浅析新版百度搜索引擎工作原理

所属分类: 网站运营 / 建站经验 阅读数: 114
收藏 0 赞 0 分享
近日,新版百度搜索引擎正式上线了,貌似除了少敲一个回车键和导航改到搜索框下方,其他没什么改变,其实未必是这样的,在新版的搜索引擎出来之前,搜索引擎在算法中就不断在完善,搜索引擎已经开始通过网站综合水平来判断排名,而不是单一的做内容、外链、点击率来提高排名,那么我们来看看,搜索引擎的哪些综合算法。

好吧,从上面的图片上看,大家可能并看不出什么东西,其实搜索引擎的算法包含非常多,搜索引擎不可能看单一的优势就给予收录于排名,以上的图片仅为搜索引擎大致的收录图,其算法还要的从头讲起。

一、抓取原理

搜索引擎在抓取到我们网站的前提是必须要有渠道,当你新建一个域名,新建了一个普通页面,页面没有经过任何人的访问,也没有任何地方出现过你的页面,那么搜索引擎是无法正确的抓取到你的页面的,之所你建议页面以后什么都没有操作,搜索引擎一样可以抓取和收录,其原因主要是通过以下几个渠道。

链接渠道:我们做外链的主要目的是什么,是传递权重还是能够更好的让搜索引擎通过这个链接来抓取我们的站点?(前提是用户点击体验除外)这是大家都在考虑的一个问题,其实更重要的是让搜索引擎能够通过此链接正确的抓取到我们的网站,这也是SEOER都在说,现在新站建议做外链,老站就没必要的原因之一。

提交渠道:80%的站点在建立以后会手动提交到搜索引擎,这是搜索引擎在收录到更多站点的一个重点渠道。当搜索引擎不知道你的站点存在的时候,你提交了你的站点,这就是直接告诉了搜索引擎,你的站点是存在的,值得搜索引擎的收录。

浏览器渠道:百度曾报道,360浏览器可更具用户流量的网页进行收集和抓取,也就是说,当用户使用了360浏览器浏览了某一个未被360搜索引擎发现的站点,那么360浏览器将会记录这个网站,然后将这个网站放到搜索引擎去处理,同样,我想百度浏览器也会做类似的事情吧。

二、收录原理

为什么同时发布两篇文章,一篇被收录,还有一篇未收录?为何我在大型网站发布的软文未收录?等等收录问题都困惑我们,其实百度对收录这一点看的相对严格,所以我们在这一点不能掉以轻心,当然,收录的原则也没有想象中那么复杂,如果你的网站能够健康的打开,收录基本不是问题,只是时间问题。

对比:当搜索引擎在抓取到你网站的文章页面的时候,会识别你的每一个内页的相同区与不同区,也就是说,你网站的不同区将会被定义为主题内容区域,然后拿着你的主题内容与其他网站的主题内容进行对比,分出你页面主题内容的原创度。

分类:通过对你的站点进行对比后,可以直接对你的内容进行分类,如同一篇关于SEO相关的文章,搜索引擎可直接通过对比来判断,你的网站属于那种类型,是否适合你的站点。

用户得分:分类之后,并不是代表搜索引擎就一定会收录你的文章,主要还是要依靠用户的得分,用户的点击率、停留时间判断出此文的价值。

小结:通过以上几点的算法,当文章的综合价值达到搜索引擎的标准值的时候,搜索引擎将会对其网站页面进行收录。

三、排名原理

搜索引擎的排名原理是大家最最关心的话题,搜索引擎的排名原理主要通过多方面来给出的,不上单一的站内优化做的多好,也不是单一的点击率有多高,综合得分得出排名主要由以下几个点进行。

点击率:从百度站长平台的关键词工具可以看出,当你的网站排名在50页之前的时候,点击率对你的网站有直接影响,这也就是很多网络公司接SEO的单,要求你网站的排名必须是多少的原因之一。

体验度:页面的体验度是更具用户的需求来定义的,当用户的重点需求在图片的时候,那么页面的体验度最核心问题就在图片上面,但是这种简单的需求基本的网站均可满足,重点还需要在简单的需求满足的情况下,在满足其他附加需求。那么搜索引擎为何能够知道用户的需求呢,主要原因还是用户在搜索框搜索的内容均被搜索引擎所记录。

当然,遇到同样是图片的站点,排名的好坏还有更多的算法,比如用户在浏览你的图片仅用1秒、而浏览竞争对手的图片用了30秒,这就意味着竞争对手的内容比你做的好,停留时间、PV、跳出率成功了搜索引擎重点考核数据。

信用度:信用度的积累可直接让搜索引擎忽略很多细节问题,直接给与排名,这就是我们经常在大站发布的外链软件很容易就获得排名的原理了,一个大型网站,经过与搜索引擎的磨合,早已被搜索引擎加入到了信任用户,所以后期的软文可以直接让搜索引擎给他一个优势排名。

总结:可能原理说的不是很全面,但以上这些原理已经得到证实,至于那些细节甚至还未被证实的原理,我并没有一一写到,我可以肯定,能够知道以上几个原理,做好排名对策的朋友,网站的排名应该还不错。

更多精彩内容其他人还在看

了解知乎网站的架构演进史

这篇文章主要介绍了了解知乎网站的架构演进史,知乎使用Python的异步框架Tornado的经验事例非常经典,值得Python学习以及爱好者们借鉴,需要的朋友可以参考下
收藏 0 赞 0 分享

企业网站要做成什么样子?是营销型网站还是官网展示

营销型网站建设是对网站的发展,整合了各种网络营销理念和网站运营管理方法,不仅注重网站建设的专业性,更加注重网站运营管理的整个过程,那么企业网站要做成什么样子?是营销型网站还是官网展?下面我们来看看吧
收藏 0 赞 0 分享

WEB标准之内容结构表现和行为到底怎么分离

从标准到国人重视那天起,就已经讨论了,但是停留在div+css xhtml+css 纯代码的分离,思想上流程上,到底如何分离
收藏 0 赞 0 分享

从网站设计到网站运营:网站建设中的六宗罪.

许多的网站越做越差,这是什么原因呢?今天小编就为大家带来一个网站从从网站设计到网站运营:网站建设中的六宗罪. 朋友们可以一起看看
收藏 0 赞 0 分享

云端架构助力魅族应用商店运维的案例分享

这篇文章主要介绍了云端架构助力魅族应用商店运维的案例分享,包括自研的Kiev框架通讯与分布式存储的使用等,非常具有借鉴意义,需要的朋友可以参考下
收藏 0 赞 0 分享

实例解析:如何做好企业网站的内容更新?

如何做好企业网站的内容更新?很多朋友都不是很清楚下面以轮滑网站为例探讨企业网站内容更新怎样做才更有档次,有需要的朋友可以过来参考一下,来看看吧
收藏 0 赞 0 分享

新手必看——电影贴吧引流都有哪些技巧

今天,我给大家讲讲电影贴吧引流都有哪些技巧,这个很适合新手,对贴吧引流都有哪些技巧感兴趣的朋友参考下
收藏 0 赞 0 分享

京东商城的云计算优先的技术战略简要总结

这篇文章主要介绍了京东的云计算优先的技术战略的简要总结,京东在Spark集群方面所投入的开发研究令人印象深刻,需要的朋友可以参考下
收藏 0 赞 0 分享

解析京东的大数据在运营中的实际应用

这篇文章主要介绍了京东的大数据在运营中的实际应用的案例,包括用户分析和企业管理决策等多方面的运用解析,需要的朋友可以参考下
收藏 0 赞 0 分享

探究京东咚咚架构演进

本文带领大家探究京东咚咚架构演进史, 自从京东开始为第三方卖家提供入驻平台服务后,咚咚也就随之诞生了,今天就和大家一起走进咚咚
收藏 0 赞 0 分享
查看更多