Google 优化蜘蛛爬取和索引的技巧

所属分类: 网站运营 / 建站经验 阅读数: 64
收藏 0 赞 0 分享

由于google掌控者搜索市场的大部分的份额,所以应时时关注和听取它的一些动态。“Google发表了一篇叫做优化蜘蛛爬取和索引的技巧”,是不是该引起我们的注意呢?

文中内容高度强调可以提高你站点爬取的能力的一些技巧,下面是陈列的关于URL的具体的例子。
 
     “互联网是个大世界,时时刻刻都有新的内容被发表,创造,”Google 分析师Susan Moskwa说到。“Google 拥有无限的资源,所以当它面临几乎无限的在线的可利用的资源时,google的蜘蛛只有能力去找寻和爬取一部分的内容,而面对已经爬取了的内容,我们又只能索引一部分。”

 Moskwa说:“URL就像一座连接你站点和搜索引擎蜘蛛之间的桥梁,蜘蛛需要能够找到并通过这座桥梁(IE,找到并爬取你的URL)到达你的网站内容页,如果你的URL地址过于复杂或是太冗余,蜘蛛就要花费很多时间去跟踪并反跟踪自己爬取的脚印,如果URL地址被很好的组织着,并直接指向相关区域的内容,这样就不会爬取到空白或是重复的内容页了。”

 如果你想被Google更好的索引,你必须删除URL地址中用户具体信息。具体情况可浏览幻灯片。基本上URL的参数时不会改变网页的内容,所以这些参数应该要删除或是放入cookie中。这样就会减少很多URL指向同一个内容的数量,加快检索。(这里应该指的就是尽量使用静态地址,少产生一些用户自带的参数的重复URL)

Google说漫无目的的无限的空间和广度其实很浪费时间,所以对于那些是唯一地址的不管是过去的还是将来的url地址,最好有一个时间标志。例如example/2009/08//11/title

告诉Google那些网页可以忽略它不需要爬取。包括一些登陆的页面,联系方式,购物车和其他的页面,类似于要求用户去执行的行为,蜘蛛是无法识别操作的。可以通过使用robots.txt文件来实现。

最后,尽可能避免重复的内容。Google希望每一个内容页面都对应一个唯一的地址。当然他们不可能全部的识别出来,因此会有一些典型链接因素存在让你去鉴别哪些特定内容网页的URL更被人们喜爱。

更多精彩内容其他人还在看

公司网站运营部门常用的报表格式

这些表格和数据专门给那种公司里的运营人员使用,主要用作网站运营的表格报表制作,很有用,完成的文件在最后有下载。
收藏 0 赞 0 分享

QQ群推广网站注意的细节问题

这次卢松松想通过详细讲解的方法,来说明我的这六种推广方式,相信会更有实际价值。
收藏 0 赞 0 分享

网站的发展方式和网站推广模式

先了解一下其他网站的发展方式,如何寻找适合自己的网站推广模式呢?
收藏 0 赞 0 分享

闲置的域名该怎么发挥下作用

为了不让闲置的域名成一种资源浪费,大致总结了以下几个常见的闲置域名的用法。
收藏 0 赞 0 分享

网站推广过程中需要注意得问题

如今网站推广的方法实在太多了,网站推广方法千篇一律,其实大家都在说,都在讲,但真正做好的却没有几人,这是为什么呢?
收藏 0 赞 0 分享

用虚拟主机做的网站如何迁移

建站经验:用虚拟主机做的网站如何迁移
收藏 0 赞 0 分享

经营一个成功得博客

如何有效经营一个博客?和群里的不少同志都讨论过这个问题。今天抽点时间写个总结吧,希望对大家有借鉴作用。
收藏 0 赞 0 分享

SEO B2B行业网站优化经验

B2B行业门户网站不同于小网站,页面的优化价值是逆向顺序,即最终页 》 专题页 》 栏目页 》 首页。
收藏 0 赞 0 分享

搜索引擎算法调整和被搜索引擎惩罚的解决方法

所有的搜索引擎优化人员手段百出,黑链,点击器,能刺激排名的方式漫天飞舞,被发挥得淋漓尽致。
收藏 0 赞 0 分享

中小型企业网站网站内容更新策略

现在看到许多中小型的企业网站不仅在展示公司本身的产品与形象,同时也会经常更新一些与本行业或企业有关的内容,那么作为企业网站到底需要更新一些什么内容呢?
收藏 0 赞 0 分享
查看更多