怎么利用robots文件做好网站优化让蜘蛛更好的抓取网站?

所属分类: 网站运营 / 网站优化 阅读数: 81
收藏 0 赞 0 分享

  robots文件存在于网站根目录,是用来告诉百度蜘蛛那些应该抓取,那些不应该抓取。正确使用robots文件有助于做好seo优化,robots文件的核心词汇就是allow和disallow用法。百度官网是认可这个文件的,在百度站长平台上也有robots这个栏目,点击进入,就可以看到你网站robots文件是否编写正确了。

  百度robots文件使用说明

  1、robots.txt可以告诉百度您网站的哪些页面可以被抓取,哪些页面不可以被抓取。

  2、您可以通过Robots工具来创建、校验、更新您的robots.txt文件,或查看您网站robots.txt文件在百度生效的情况。

  3、Robots工具暂不支持https站点。

  4、Robots工具目前支持48k的文件内容检测,请保证您的robots.txt文件不要过大,目录最长不超过250个字符。

  

  上图我给的一个例子中,disallow语句有问题,原因是把英文的冒号写成了中文的冒号。

  当然直接输入网站根目录加上robtots.txt文件也可以

  

  User-agent:*   是用来置顶那些搜索引擎蜘蛛可以抓取的,一般默认设置

  Disallow:/category/*/page/ 分类目录下面翻页后的链接,比如,进入校赚网分类目录 "推广运营经验"目录后,在翻页一次,就成了 stcash.com/category/tuiguangyunying/page/2形式了

  Disallow:/?s=* Disallow:/*/?s=*  搜索结果页面和分类目录搜索结果页面,这里没必要再次抓取。

  Disallow:/wp-admin/ Disallow:/wp-content/ Disallow:/wp-includes/   这三个目录是系统目录,一般都是屏蔽蜘蛛抓取

  Disallow:/*/trackback  trackback的链接

  Disallow:/feed Disallow:/*/feed Disallow:/comments/feed  订阅链接

  Disallow:/?p=*   文章短链接,会自动301跳转到长连接

  例如,朱海涛博客之前就被收录过短连接

  Disallow:/*/comment-page-*   Disallow:/*?replytocom* 这两个我在之前文章有过说明,来自于评论链接,很容易造成重复收录。

  在robots.txt文件的最后还可以制定sitemap文件 Sitemap:http://***.com/sitemap.txt

  sitemap地址指令,主流是txt和xml格式。在这里分享一段张戈所写txt格式的simemap文件。

  将上述代码保存到txt文件,上传到根目录,并且在robots.txt文件中指定即可

  这里给大家共享下我的robots.txt文件

复制内容到剪贴板
  1.   User-agent: *   
  2.   
  3.   Disallow:/wp-admin/   
  4.   
  5.   Disallow: /*/comment-page-*  
  6.  
  7.   Disallow: /*?replytocom*  
  8.  
  9.   Disallow: /wp-content/  
  10.  
  11.   Disallow: /wp-includes/  
  12.  
  13.   Disallow: /category/*/page/   
  14.   
  15.   Disallow: /*/trackback  
  16.  
  17.   Disallow: /feed  
  18.  
  19.   Disallow: /*/feed   
  20.   
  21.   Disallow: /comments/feed   
  22.   
  23.   Disallow: /?s=*   
  24.   
  25.   Disallow: /*/?s=*\  
  26.  
  27.   Disallow: /attachment/  
  28.  
  29.   Disallow: /tag/*/page/   
  30.   
  31.   Sitemap: http://www.stcash.com/sitemap.xml  
更多精彩内容其他人还在看

关键字排名下降原因分析

很多站长都苦恼自己的网站关键字排名下降,每一次的更新都牵绊着很多站长的心,下面我把关键字排名下降的原因做一个归总。
收藏 0 赞 0 分享

新站寻找友情链接的方法

网站友情链接就是你链接我,我链接你的网站,而且在网站代码中能找到网站的名称和地址,就这样相互链接的一个过程。
收藏 0 赞 0 分享

百度对友情链接网站的权重分配分析

Google存在pr,存在权重投票。百度呢,这边没有明显的衡量标准,杭州SEO的空间更换之后今天首页快照终于出现了一次更新,期待明天会是同样的快照更新,现在排名在第二页了,做了浙江SEO、上海SEO还有一些词汇做了一些权重分散。
收藏 0 赞 0 分享

从优化比较成功网站的共同特征

关于SEO做的比较好的网站的几个特征,相信大家对SEO技术都有一定的研究和功力了,一个用SEO技术优化得很好的网站会有以下几个特征
收藏 0 赞 0 分享

才能更准确查看反向链接分析

如何知道有多少个站链接指向我的站?做SEO网站推广我们要知道如何更准确查看反向链接?
收藏 0 赞 0 分享

做好网站内部链接优化的经验分享

什么是内部链接?内部链接和外部链接有什么不同?
收藏 0 赞 0 分享

同时做好站内优化和站外优化

SEO可以简分为两类:站内SEO和站外SEO,那么站内和站外的SEO优化区别是什么呢?
收藏 0 赞 0 分享

搜索引擎优化多元化的技巧分析

随着互联网的不断发展和成熟!搜索引擎的算法也越来越智能化,搜索引擎的算法变更也越来越频繁,如何在以后的搜索引擎优化中保持不败的地位,这个成了每个做网站优化的人最关心的事情了。
收藏 0 赞 0 分享

优化网站内容页面更能得到百度的喜爱的方法

自从谷歌迁至香港后,百度搜索引擎便独占大部分中国搜索引擎市场,而百度的算法技术也越来越成熟。
收藏 0 赞 0 分享

通过多站分析出网站被降权的根本原因

笔者通过分析www.daqifang.com得出以下几点网站被降权的原因
收藏 0 赞 0 分享
查看更多