《百度搜索引擎网页质量白皮书》学习笔记2-网页质量维度

发布于 2022-05-09  476 次阅读


百度搜索引擎在衡量网页质量时,会从内容质量浏览体验可访问性三个维度综合考虑给出一个质量打分。

百度网页质量度标准
百度网页质量度标准

一、衡量网页质量的维度1——内容质量

网页内容质量好,宽泛说就是网页主题内容好,让用户满意。

不同类型网页的主体内容不同,百度搜索引擎判断不同网页的内容价值时,需要参考的标准也不同,百度官方给了以下参考案例:

首页:导航链接和推荐内容是否清晰、有效。
文章页:能否提供清晰完整的内容,图文并茂更佳。
商品页:是否提供了完整真实的商品信息和有效的购买入口。
问答页:是否提供了有参考价值的答案。
下载页:是否提供下载入口,是否有权限限制,资源是否有效。
文档页:是否可供用户阅读,是否有权限限制。
搜索结果页:搜索出来的结果是否与标题相关。

1.1网页内容质量好

百度搜索引擎认为内容质量好的网页,花费了较多时间和精力编辑,倾注了编者的经验和专业知识;内容清晰、完整且丰富(这点我觉得基本都能做到);资源有效且优质;信息真实有效安全无毒不含任何作弊行为和意图,对用户有较强的正收益。

其中,对用户有“正收益”这点,个人感觉是站在用户角度考虑,比如在手机百度搜索结果页中,最新的版本里搜索结果都是块状的,用户是可以点赞的,如果点赞的用户越多,“正收益”就越大?虽然可以刷这个点赞,但是就“正收益”“有用性”来说,看了你的网页答案用户觉得写得不对,自然就会点个“倒赞”。

手机百度搜索结果页
手机百度搜索结果页

但是站在百度搜索引擎的立场,百度搜索引擎判断网页内容为优的标准是:

专业医疗机构发布的内容丰富的医疗专题页面
资深工程师发布的完整解决某个技术问题的专业文章
专业视频网站上,播放清晰流畅的正版电影或影视全集页面;
知名 B2C 网站上,一个完整有效的商品购买页
权威新闻站原创或经过编辑整理的热点新闻报道;
 经过网友认真编辑,内容丰富的词条
问答网站内,回答的内容可以完美解决提问者的问题。

然后针对以上维度,百度官方给出了几个典型的内容质量为好的案例:

实例内容质量说明
case 1.1.1-1专业医疗网站发布的丰富医疗专题页面
case 1.1.1-2资深工程师发布的完整解决某个技术问题的专业文章
case 1.1.1-3专业视频网站上,播放清晰流畅的正版影视全集页面
case 1.1.1-4京东的一个完整有效的商品购买页
case 1.1.1-5权威新闻站原创的热点新闻的报道
case 1.1.1-6经过网友认真编辑,内容丰富的百科词条
case 1.1.1-7百度知道上,完美解决用户问题的问答页
网页内容质量为好的案例(来源:百度站长平台)

哎,第二个案例是IBM Develpoer的,纯英文网站,话说百度你不是中文搜索引擎吗?擦汗.jpg

1.2网页内容质量中

内容质量中等的网页往往能满足用户需求,但未花费较多时间和精力进行制作编辑,不能体现出编者的经验和专业知识;内容完整但并不丰富;资源有效但质量欠佳;信息虽真实有效但属采集得来;安全无毒;不含作弊行为和意图。

百度官方给出第二梯度,网页内容质量为中的案例:

 论坛类网站里一个普通的帖子;
 一个普通的问答网页;
 没有进行任何编辑,直接转载其它网站的新闻;
 无版权信息的普通电影播放页
 采集知名小说网站的盗版小说页。

实例:

实例内容质量说明
case 1.1.2-1网易直接转载了中国新闻网的一篇新闻
case 1.1.2-2文库上网友上传的“国庆放假安排”新闻
case 1.1.2-3采集起点小说网的盗版小说站
case 1.1.2-4百度贴吧里一个普通的帖子
case 1.1.2-5百度知道一个普通的问答页,还没有最佳答案
网页内容质量为中的案例(来源:百度站长平台)

看了这些,我首先感觉自己的博客应该是属于第二梯队“网页内容质量中”了,虽然都是原创和伪原创,从来没直接复制别人的全文,有引用都标注了,但是毕竟咱不是百度认证的专业人士,也不是权威网站。其次是,哇靠,我辛苦整的博客居然跟盗版小说采集站是一个梯队。。。

那么,是不是说,一般我们做网站优化,对于采集可以并不是那么排斥,不用全部都是原创和伪原创的文章,追求这两点之前,先把平台的权威性和身份的专业性解决了再说。

不过,换一种角度看,我们也能得出一个在百度搜索上布局“长尾词霸屏”的常规打法,比如,百度百家号认证的医生、律师、作家、教师、工程师、厨师、烘焙师、木工、电工、焊工、心理咨询师、证券分析师等等,在百家号、百度知道、百度文库、知乎等权威平台上,哪怕是复制一些普通文章,就能达到内容质量为中,如果是专业性文章,达到内容质量为好的概率就很大。

那么我们就可以用这些账号去发布一些长尾词软文,排名和展现就会很好。如果部分平台无法发软文,再在自家网站上辅助发布。

1.3网页内容质量差

主体内容信息量较,或无有效信息、信息失效过期

百度官方明确表示:

内容质量差网页,对用户没有什么实质性的帮助,应该减少其展现的机会。同时,如果一个网站内 该类网页的占比过大,也会影响百度搜索引擎对站点的评级,尤其是 UGC 网站、电商网站、 黄页网站要尤其重视对过期、失效网页的管理。

《百度搜索引擎网页质量白皮书》

内容质量差的网页评判维度:

已下架的商品页,或已过期的团购页;
 已过有效期的招聘、交易页面;
资源已失效,如视频已删除、软件下载后无法使用等。

1.4没有内容质量可言

emm,为啥还会有这一级,显然,到这里你一定要注意了,自己网站有没有这一梯队的表现,如果有,必须尽快修正。

没有内容质量可言的网页指那些制作成本很低,粗制滥造;从别处采集来的内容经最起码的编辑整理即放置线上;挂木马等病毒;含有作弊行为或意图;完全不能满足用户需求, 甚至含有欺骗内容的网页。

也就是说,网页内容质量最差的一个梯队的表现是:采集不排版+木马+作弊+欺骗(比如标题党)

内容空短,有很少量的内容,却不能支撑页面的主要意图;
 问答页有问无答,或回答完全不能解决问题--文不对题
 站内搜索结果页,但没有给出相关信息

然后百度站长给出的最差的几个案例,必须要贴上来,大家一定要比照自己的做法,有则改之,无则加勉

实例网页内容质量说明
case 1.1.4-1内容空短,有很少量的内容,不能支撑页面的主要
意图
case 1.1.4-1没有找到相关内容的搜索结果页
case 1.1.4-1文章有标题,但没有任何内容
case 1.1.4-1问答页,只有问题没有回答
case 1.1.4-1回答完全不能解决问题
case 1.1.4-1文章有标题,但主体内容还未发布
网页内容毫无质量的案例(来源:百度站长平台)

好吧,百度给的案例的链接也失效了。

不过根据说明,大家还是能够明白其中的意思的。

真要好好做一个博客,优化一个企业官网,最后两梯队的维度一定要谨慎对待。其实做到这些,你会发现你的网站至少也是百度的“网页内容质量”为中的标准了。

如果还想继续往上优化“百度网页内容质量”,你大概也就是往“权威性”和“专业性”上去优化了,比如在行业内做好口碑,做好百度官网标识,提升自身的专业性,做专业性身份认证,权威新闻媒体的正面报道(如人民网、华夏网)等。

二、衡量网页质量的维度2——浏览体验

用户希望看到干净、易阅读的网页,排版混乱广告过多会影响用户对网页主体内容的获取。目前百度搜索引擎主要从内容排版广告影响两方面对网页浏览体验进行考量。

排版怎么好就不说了,关于广告,“内容为主,广告为辅”。那好的太笼统,没法说,差的表现一定要牢记,不要学!

 正文内容不换行或不分段,用户阅读困难;
字体和背景颜色相近,内容辨别困难;
 页面布局不合理,网页首屏看不到任何有价值的主体内容;
广告遮挡主体内容;或者在通用分辨率下,首屏都是广告,看不到主体内容;
弹窗广告过多
 影响阅读的浮动广告过多
 点击链接时,出现预期之外的弹窗;
广告与内容混淆,不易区分

上述最后一条,有些难受,不好区分,比如你做不做软文,所谓的软文就是一种“虽然是付费广告但尽量做到看上去像正常内容”的互联网广告形式,那不就符合浏览体验差的标准了?

面对内容质量相近的网页,浏览体验佳者更容易获得更高的排位,而对于浏览体验差的网页,百度搜索引擎会视情况降低其展现的机率甚至拒绝收录。

三、衡量网页质量的维度3——可访问性

百度搜索引擎会从正常打开权限限制有效性三方面判断网页的可访问性,对于可以正常访问的网页,可以参与正常排序;对于有权限限制的网页,再通过其它维度对其进行观察;对于失效网页,会降权其展现机制甚至从数据库中删除。

其实很好理解。

3.1可正常访问的网页

能够打开即可,但是有一点,访问速度最好快些,像我这个博客,打开就很慢,当然,博主穷,买不起好的服务器啊。

如果你是做企业官网项目,那肯定要花钱在这块。(不过对于加载速度百度官方这次居然没提)

3.2有权限限制的网页

指打开网页都需要登录权限,没有权限完全无法看到具体内容,比如早先各APP网自身引流,在手百搜到其网站文章时,只显示一半,需要下载APP方能查看,最后被百度叫停了。

指获取网页主要内容,如文档、软件、视频等,需要权限或者需要安装插件才能获得完整内容。此时会分三种情况:

 提供优质、正版内容的网站,由于内容建设成本很高,尽管查看全文或下载时需要 权限或安装插件,但属于用户预期之内,百度搜索引擎也不认为权限行为对用户造 成伤害,给予与正常可访问页面相同的对待——比如起点、爱奇艺、腾讯视频等。
 对于一些非优质、非正版的资源,来自于用户转载甚至机器采集,本身成本较低, 内容也不独特,用户获取资源还有权限限制——需要用户注册登录或者付费查看, 百度搜索引擎会根据具体情况决定是否调整其展现。
 还有一些视频、下载资源页,也许自身资源质量并不差,但需要安装非常冷门的插件才能正常访问,比如要求安装“xx 大片播放器”,百度搜索引擎会怀疑其有恶意倾向。

3.3失效的网页

失效网页包括但不仅限于:

 404、403、503 等网页;
 程序代码报错网页;
 打开后提示内容被删除,或因内容已不存在跳转到首页的网页;
 被删除内容的论坛帖子,被删除的视频页面(多出现在 UGC 站点)

对于此类,做好301重定向,及时删除死链即可。

OK,关于《百度搜索引擎网页质量白皮书》有用的也就这么多了。如果此文对您有用,请赞一个先。

——The End——