Google 优化蜘蛛爬取和索引的技巧

所属分类: 网站运营 / 建站经验 阅读数: 87
收藏 0 赞 0 分享

由于google掌控者搜索市场的大部分的份额,所以应时时关注和听取它的一些动态。“Google发表了一篇叫做优化蜘蛛爬取和索引的技巧”,是不是该引起我们的注意呢?

文中内容高度强调可以提高你站点爬取的能力的一些技巧,下面是陈列的关于URL的具体的例子。
 
     “互联网是个大世界,时时刻刻都有新的内容被发表,创造,”Google 分析师Susan Moskwa说到。“Google 拥有无限的资源,所以当它面临几乎无限的在线的可利用的资源时,google的蜘蛛只有能力去找寻和爬取一部分的内容,而面对已经爬取了的内容,我们又只能索引一部分。”

 Moskwa说:“URL就像一座连接你站点和搜索引擎蜘蛛之间的桥梁,蜘蛛需要能够找到并通过这座桥梁(IE,找到并爬取你的URL)到达你的网站内容页,如果你的URL地址过于复杂或是太冗余,蜘蛛就要花费很多时间去跟踪并反跟踪自己爬取的脚印,如果URL地址被很好的组织着,并直接指向相关区域的内容,这样就不会爬取到空白或是重复的内容页了。”

 如果你想被Google更好的索引,你必须删除URL地址中用户具体信息。具体情况可浏览幻灯片。基本上URL的参数时不会改变网页的内容,所以这些参数应该要删除或是放入cookie中。这样就会减少很多URL指向同一个内容的数量,加快检索。(这里应该指的就是尽量使用静态地址,少产生一些用户自带的参数的重复URL)

Google说漫无目的的无限的空间和广度其实很浪费时间,所以对于那些是唯一地址的不管是过去的还是将来的url地址,最好有一个时间标志。例如example/2009/08//11/title

告诉Google那些网页可以忽略它不需要爬取。包括一些登陆的页面,联系方式,购物车和其他的页面,类似于要求用户去执行的行为,蜘蛛是无法识别操作的。可以通过使用robots.txt文件来实现。

最后,尽可能避免重复的内容。Google希望每一个内容页面都对应一个唯一的地址。当然他们不可能全部的识别出来,因此会有一些典型链接因素存在让你去鉴别哪些特定内容网页的URL更被人们喜爱。

更多精彩内容其他人还在看

网站备案被注销引发网站生存危机 未备案网站该如何运营

从今年年初开始,工信部开展了“清理空壳网站和备案信息不准确的网站”的活动,对空壳类备案数据进行处理,所有网站备案号对应的网站备案信息因无接入或接入信息不准确等原因,备案号都会被注销
收藏 0 赞 0 分享

如何运营地方网站 个人站长的一点经验

09年是区域网站发展最为迅速的一年。很多公司或者个人纷纷投入到地方网站的运营当中。二手网,团购网,论坛如雨后春笋般冒出于网络
收藏 0 赞 0 分享

大量老备案被删除 域名ICP备案开始严查

互联网行业再次严打,又是一次行业大洗牌,很多小站长的生计又完了,可怜的IT达人们
收藏 0 赞 0 分享

从工信部注销备案谈中小站长生存之道 附临时解决方法

最近沸沸扬扬的备案事件让许多小站长伤透了脑筋,却不知道如何应对这种突发事件,就像服务器出问题一样,很多人知道到使用,却不知道遇到问题如何解决
收藏 0 赞 0 分享

做网站,做站长省钱的100个技巧分享

做网站,做站长省钱的100个技巧分享,图王为即将做网站的朋友提供的一些宝贵经验。
收藏 0 赞 0 分享

网站做到简单就是良好的用户体验

互联网上无论是哪一家网站,都会把用户体验放在很重要的位置,无论这个这个网站是提供服务的还是提供产品展示的,一个好的网站,一定离不开好的用户体验。
收藏 0 赞 0 分享

分享被K网站经验 提醒站长吸取教训

其实写这篇文章,我一直在想是把我的网站经历写出来,还是把创业经历写出来,题目也很矛盾,最终定位还是分享网站经验了,目的就是提醒大家吸取教训,SEO和做站都是一个长久的过程,不能急求。
收藏 0 赞 0 分享

小站长该如何选择广告联盟

相信很多中小站长,最头疼的问题就是对于广告联盟的选择了。尤其是对于小站长来说,小联盟存在支付风险,而且会有很多的不良内容,很容易让自己的网站因此被封。
收藏 0 赞 0 分享

浅析网站会进入百度沙盒的原因分析 推荐

首先来介绍什么是百度沙盒?通常百度沙盒的形成原因是因为网站被修改或者进行了作弊而影响了网站快照的正常更新,收录也正常,就是看不到相关的关键词的排名,或者说以前有不错排名的关键词突然就没有了排名!
收藏 0 赞 0 分享

浅谈网站关键词的选取与推广

选取时树干,推广时树枝,只有树枝茂密,才能叫参天大树!那如何做好关键词的推广呢?
收藏 0 赞 0 分享
查看更多