Google排名 网页加载速度和SEO的关系

所属分类: 网站运营 / 网站优化 阅读数: 155
收藏 0 赞 0 分享

“谷歌中文网站管理员博客”刚刚发表了一篇新文章,介绍了一下《google 网站管理员工具》中推出的新功能 -“网站性能”。这个工具是通过google工具栏记录了用户访问你网站的速度,并给出了很多加快你网站速度的建议。

http://www.googlechinawebmaster.com/2009/12/blog-post_30.html

而最近也传闻google将会把网页加载速度作为影响排名的一个因素。那么网页打开速度是不是能影响SEO效果?如果能影响,那是怎么影响的呢?

在揭示其中的道理之前,我希望大家能把上面那些传闻或“网站性能”的功能都忘掉。让我们追本溯源,来看看网页打开速度和SEO流量之间的关系。

做SEO有时候不需要听从别人给你的信息和意见,你只要专注于研究搜索引擎,同样也能成功的。这种关系的发现,也得益于早期我非常重视数据分析,所以我在《怎么样去学SEO(二)》中把数据分析能力列为SEOer应该具备的四大能力之一。由于有很多数据做支撑,现在我来给大家分析其中的联系,大家就容易看懂很多。

到了后期,连google也认识到了网页速度和SEO流量之间的关系,所以在这个“网站性能”以前就推出过相关的工具来帮助网站管理员。

要说明这种关系,就要从搜索引擎爬虫说起。不知道大家对于搜索引擎爬虫在一个网站上的行为有没有概念,我现在发一下某个网站(不是alibaba)的一些数据出来,大家就能意识到一些爬虫的特性了。下面是从服务器LOG日志中分析出的数据。

爬虫访问次数

图1:爬虫访问次数

—-

爬虫停留时间

图2:爬虫停留时间

从上面图1中可以看到google访问这个网站206次,这206次里面是由很多个不同的爬虫访问的。图2显示:有的爬虫一天之内来了8次,一共停留了2小时左右,有的爬虫来了1次,停留了20多个小时以上。所以这个网站是被很多个爬虫在不间断的访问的。为了计算方便,可以把google所有的爬虫停留在这个网站的总时间加起来。虽然一天只有24个小时的,但是google的爬虫这一天花在这个网站上的时间可能是成百上千多个小时。这里真实的数据是:在这个网站中,google所有爬虫那天在这个网站上花费的实际总时间是721个小时。

而服务器LOG日志里同样可以分析出爬虫在一个网页上的停留时间。如:

爬虫停留时间

图3:爬虫停留时间

得到了这两个数据以后,用所有爬虫总的停留时间除以单个页面的停留时间,就是搜索引擎爬虫这天所抓取的页面总量。

721 小时× 3600 秒 ÷ 35 秒 = 74160 页

那么得到这个搜索引擎爬虫这天所抓取的页面总量有什么用呢?

对于一般的小网站来说,一天能被抓取 74160页是一个很不错数据。但是我上面给出的是一个中型网站,它整个网站的页面总量有800多万有SEO价值的页面。那么,在最理想的情况下,这些页面被搜索引擎抓取完要花费的时间为:

800万 ÷ 74160 页 = 108 天

这是理论上最理想的情况,实际上真实的情况为:

由于有多个爬虫在抓取网站,有很多的页面在一天之内是会被爬虫重复抓取的。有的页面一天之内被抓取20多次,有的页面一天之内只被抓取1次。通过 “停留总时间 ÷ 单个页面停留时间” 得到的页面数量,是没有去除那些重复抓取的页面的。所以搜索引擎一天之内实际抓取的不重复页面没有74160页那么多,而是40000页的样子。还有一点,爬虫今天抓取的页面,到了明天还有很多会被重复抓取。所以爬虫不光在同一天内会重复抓取很多页面,而且到了下一天还是会重复抓取前一天抓取过的很多页面。

这样下来,爬虫平均每天抓取不重复的页面数量就只有10000页的样子了。那么,要爬虫把这个网站所有的页面抓取完需要的时间为:

800万 ÷ 1万页 = 800天

其实,这个800天抓取完整个网站还是太理想化了。实际的情况是很多网站由于结构的原因,有些网页创建后4-5年,都还没被爬虫抓取过。

上面的这个分析过程,都没用到什么惊天动地的计算方法。只要你有一点数据分析的意识,就能看清楚事实的。当一个网站收录量不理想,大家就应该去看看那些页面是不是被搜索引擎爬虫浏览过。如果一个页面都没有被搜索引擎爬虫浏览过,是不可能会被收录的。一个网站的收录量没有上去,那SEO流量的提升就会有很大的一个瓶颈。

根据我们刚才上面的那个分析过程,要提升网站的收录量,首先要解决的就是搜索引擎每天抓取网站的抓取量。而:

抓取量 = 爬虫总的停留时间 ÷ 单个页面的停留时间

一个网站,爬虫总的停留时间在某个期间是保持相对固定的。当然,有方法提高爬虫总的停留时间,不过这不是这篇文章要讲的内容。我们先通过减少个页面的停留时间也可以增加爬虫的抓取量。

减少爬虫单个页面的停留时间,可以简单的认为提高网页加载速度就可以了,虽然实际上这两个因素之间还存在着一个对应关系,但是这里先不讲。这个时候,网页的加载速度就和抓取量之间有了一个正比的关系,网页加载速度越快,爬虫整个的抓取量就越大。抓取量越大,有效收录量就会增加,从而促使SEO流量增加,因为给一个大中型网站带来流量的,90%以上都是长尾词。大中型网站,有时甚至是小网站,只要收录量增加一定的百分比,SEO流量也会增加一定的百分比。网页的加载速度,就和SEO流量之间建立了一个这样的关系。

其实,google也知道网页速度和SEO流量之间的关系,所以早在“网站性能”这个功能推出以前,就推出了另一个功能让大家去用,那个功能就是“google 网站管理员工具”里的“抓取统计信息”。那里把爬虫对你网站的抓取量,和你网页下载的平均时间都列了出来。

如果大家平常注意观察这里面的数据就会发现这样的规律:一旦网站下载时间减少了,那抓取量就会增大一点。

一般小网站,这样的规律还不是太明显。因为有其他影响这个规律的因素存在,而且小网站页面数太少了,爬虫随便多增加几百页的抓取量就影响了50%以上的抓取量。但是在大中型网站,这个规律是非常明显的。如:

抓取统计信息

抓取统计信息

当这个网站加快了网页加载速度,爬虫的抓取量就稳步增加了。这个图表能很有利的证明上面提到的理论。

这个图表也再次证明了我在《google 的良苦用心:网站管理员工具》里说的:“google网站管理员工具里的每个功能都是和SEO相关的”。

关于网页速度和排名,google否认曾经将网页速度列为提高排名的因素。而 Matt Cutts 最近也说:In a nutshell – while slow page load times won’t negatively impact your rankings, fast load times may have a positive effect. 有人把它翻译成:网页加载速度慢,不会影响Google排名,但是网页加载快却对排名有积极作用。 其实这样翻译是没有理解这句话,Matt Cutts的意思是:网页加载速度慢,不会影响Google排名,但是网页加载快却有积极作用。拿掉以前那个翻译中的“对排名”三个字即可。至于其中的原因,我想通过这篇文章大家都理解了吧。

这也是为什么我要在《内部链接还是外部链接》里强调一下的:有时候是因为“你没有掌握到他们那么多信息,所以你无法理解他们的话。也不会推测出他们的潜台词以及他们没有说全的话而已。” 我其实很少关注Matt Cutts说什么,但是我看到那篇翻译的文章,就断定Matt Cutts不会那么说。

另外,这个文章中的LOG日志分析工具,在我最近建立的“新基地论坛”上有下载。不过那里需要论坛金币才能下载的。获得论坛金币最快的方法就是把你所拥有的好资源也贡献出来。我希望能用这个方法创造一个“人人为我,我为人人”的环境,做一个高质量的论坛。

原文地址:http://www.semyj.com/archives/969

更多精彩内容其他人还在看

SEO新站点nofollow标签的妙用

Nofollow是最早由Google领头新创的一个标签,目的是尽量减少垃圾链接对搜索引擎的影响。近日有网友咨询nofollow标签怎么用?今天我们就来看看SEO新站点nofollow标签的妙用有哪些
收藏 0 赞 0 分享

针对SEO所必备的搜索引擎工作原理知识

这篇文章主要介绍了针对SEO所必备的搜索引擎工作原理知识,简单地讲解了搜索引擎处理数据的一般流程,帮助SEO者针对搜索网站进行相关优化,需要的朋友可以参考下
收藏 0 赞 0 分享

网站为何被降权?网站降权诊断分析以及恢复排名操作

网站降权是指搜索引擎对网站评定的级别下降,是搜索引擎对网站进行的一种处罚方式,导致网站整体排名下降,但通常多为网站自身作弊导致的,改正错误一段时间后会自行恢复,本文将提供网站降权诊断分析以及恢复排名操作供大家了解,希望对大家有所帮助和启发
收藏 0 赞 0 分享

网站SEO优化最容易进入的四个误区

我们发现一个网站经常优化过后排行和收录还是不好,今天我们就用一个广告衫网站seo的几个错误点作为实例,来个大家分析网站SEO优化绝对不能进入的误区,需要的朋友可以参考下
收藏 0 赞 0 分享

SEO友情链接交换技巧 专业SEO交换友情链接必须要知道的一些SEO知识

友情链接是网站和网站之间优势互补的一种比较便捷的合作形式,其操作形式是分别在自己的网站上放置对方网站的LOGO链接或锚文本链接,这样可以达到互相推广的目的,因此常作为一种网站推广最基本手段
收藏 0 赞 0 分享

网站不收录的因素有哪些 如何注意

常常会有人问到网站为什么不收录,网站为什么收录这么少的问题,其实网站的收录并不与排名有直接的联系,那么本文来分析网站不收录的因素有哪些,感兴趣的小伙伴们可以参考一下
收藏 0 赞 0 分享

新手必读:百度下拉框暗藏的SEO技巧

随着百度算法的调整,搜索引擎的宗旨就越来越明显,“客户体验度”自然被很多站长摆在桌面,那么作为一个SEO人员,百度下拉框暗藏什么SEO秘诀呢?本文将提供相关内容供大家了解,希望对大家有所帮助和启发
收藏 0 赞 0 分享

如何挖掘网站长尾关键词?58同城seo优化解析详解

一个网站想要获得海量的流量,就一定要懂得做长尾关键词的排名优化。那么什么是长尾关键词呢?如何挖掘网站长尾关键词?本文将提供58同城seo优化解析详解供大家了解,希望对大家有所帮助和启发
收藏 0 赞 0 分享

营销技巧:如何做到半年不更新文章和发布外链都能稳定排名

刚刚接触营销知识的时候,完全不知道营销知识和SEO有半毛钱关系,但很多排名大咖都是靠营销结合SEO进行操作,有时候就纳闷了,为何人家半年不更新一篇文章,每天流量爆满,本文将提供相关经验供大家了解,希望对大家有所帮助和启发
收藏 0 赞 0 分享

安全宝CDN加速服务的配置和使用攻略

这篇文章主要介绍了安全宝的CDN加速服务的配置和使用攻略,文中还讲到了安全宝的防盗链和云web防火墙等附加功能,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多