怎么利用robots文件做好网站优化让蜘蛛更好的抓取网站?

所属分类: 网站运营 / 网站优化 阅读数: 55
收藏 0 赞 0 分享

  robots文件存在于网站根目录,是用来告诉百度蜘蛛那些应该抓取,那些不应该抓取。正确使用robots文件有助于做好seo优化,robots文件的核心词汇就是allow和disallow用法。百度官网是认可这个文件的,在百度站长平台上也有robots这个栏目,点击进入,就可以看到你网站robots文件是否编写正确了。

  百度robots文件使用说明

  1、robots.txt可以告诉百度您网站的哪些页面可以被抓取,哪些页面不可以被抓取。

  2、您可以通过Robots工具来创建、校验、更新您的robots.txt文件,或查看您网站robots.txt文件在百度生效的情况。

  3、Robots工具暂不支持https站点。

  4、Robots工具目前支持48k的文件内容检测,请保证您的robots.txt文件不要过大,目录最长不超过250个字符。

  

  上图我给的一个例子中,disallow语句有问题,原因是把英文的冒号写成了中文的冒号。

  当然直接输入网站根目录加上robtots.txt文件也可以

  

  User-agent:*   是用来置顶那些搜索引擎蜘蛛可以抓取的,一般默认设置

  Disallow:/category/*/page/ 分类目录下面翻页后的链接,比如,进入校赚网分类目录 "推广运营经验"目录后,在翻页一次,就成了 stcash.com/category/tuiguangyunying/page/2形式了

  Disallow:/?s=* Disallow:/*/?s=*  搜索结果页面和分类目录搜索结果页面,这里没必要再次抓取。

  Disallow:/wp-admin/ Disallow:/wp-content/ Disallow:/wp-includes/   这三个目录是系统目录,一般都是屏蔽蜘蛛抓取

  Disallow:/*/trackback  trackback的链接

  Disallow:/feed Disallow:/*/feed Disallow:/comments/feed  订阅链接

  Disallow:/?p=*   文章短链接,会自动301跳转到长连接

  例如,朱海涛博客之前就被收录过短连接

  Disallow:/*/comment-page-*   Disallow:/*?replytocom* 这两个我在之前文章有过说明,来自于评论链接,很容易造成重复收录。

  在robots.txt文件的最后还可以制定sitemap文件 Sitemap:http://***.com/sitemap.txt

  sitemap地址指令,主流是txt和xml格式。在这里分享一段张戈所写txt格式的simemap文件。

  将上述代码保存到txt文件,上传到根目录,并且在robots.txt文件中指定即可

  这里给大家共享下我的robots.txt文件

复制内容到剪贴板
  1.   User-agent: *   
  2.   
  3.   Disallow:/wp-admin/   
  4.   
  5.   Disallow: /*/comment-page-*  
  6.  
  7.   Disallow: /*?replytocom*  
  8.  
  9.   Disallow: /wp-content/  
  10.  
  11.   Disallow: /wp-includes/  
  12.  
  13.   Disallow: /category/*/page/   
  14.   
  15.   Disallow: /*/trackback  
  16.  
  17.   Disallow: /feed  
  18.  
  19.   Disallow: /*/feed   
  20.   
  21.   Disallow: /comments/feed   
  22.   
  23.   Disallow: /?s=*   
  24.   
  25.   Disallow: /*/?s=*\  
  26.  
  27.   Disallow: /attachment/  
  28.  
  29.   Disallow: /tag/*/page/   
  30.   
  31.   Sitemap: http://www.stcash.com/sitemap.xml  
更多精彩内容其他人还在看

采用正当网站策略来优化网站的方法(图文)

网站优化中需要注意哪些策略呢
收藏 0 赞 0 分享

对淘宝网搜索规则以及排名规则的探讨(图文)

把淘宝的搜索规则弄懂了.才会更有利于商品的排名及名称优化
收藏 0 赞 0 分享

百度知道做电影流量关键词的技巧分析

 现在做关键词的手段各式各样,最终的目的还是为了流量。一部热门影片的搜索指数高到吓人,但能够出现在百度搜索结果前列的个人网站并不多,大部分都是百度百科,时光网,贴吧,大牌视频网站。
收藏 0 赞 0 分享

SEO是什么?SEO搜索引擎优化相关术语介绍

SEO(Search Engine Optimization),汉译为搜索引擎优化,是较为流行的网络营销方式及NNT流量,主要目的是增加特定关键字的曝光率以增加网站的能见度,进而增加销售的机会
收藏 0 赞 0 分享

6.22百度k站事件给我们的反思 做优质内容站

相信大家最近一段时间都知道6.22 6.28百度地震的事件吧。最近我在一些seo论坛和一些站长论坛听到很多人都说百度从6月22日开始很多网站被k了,相距6月28日又有很多站长反应被k站的问题
收藏 0 赞 0 分享

百度最喜欢什么样的网站分享

其实不论是什么网站,只要用户喜欢,自己热爱的网站,能帮助到别人的网站就是好网站,自然也就百度喜欢了,坚持与优质内容
收藏 0 赞 0 分享

链接的数量、广泛多样化是把双刃剑 成功要得法

搜索引擎越来越重视用户体验已经是个趋势,但是这并不能否定链接和原创内容的重要性
收藏 0 赞 0 分享

让你更好的利用外链资源做网站推广(四点原则)

外链在网站推广中的作用大家都是知道的,那么关于外链资源的应用有哪些方法和技巧呢,武汉seo公司要是能够运用好外链资源,seo优化就能起到事半功倍的作用
收藏 0 赞 0 分享

网站上线后应按照方法做seo推广工作小结

刚刚新建起来的一个网站,下一步的工作就是做好网站推广了,那么网站推广工作的展开要怎么开始呢,所要做的基本工作是哪些,下面武汉seo公司就为新手朋友做个简单介绍吧
收藏 0 赞 0 分享

利用相关性提高网站关键词排名的方法

大家都知道网站的相关性对整个网站的专业性,网站的权威性,网站的权重高低都有一个非常重要的评价,如果我们能从网站的主题,内容,以及外链等加以深化做到相关性非常高的话对网站关键词排名是非常有好处的
收藏 0 赞 0 分享
查看更多