搜索引擎喜欢UTF-8编码robots.txt

所属分类: 网站运营 / 网站优化 阅读数: 1482
收藏 0 赞 0 分享

所以请问,你网站根目录下的robots.txt文件是UTF-8编码吗?如果不是,建议你修改为该编码。

Google Groups成员指出包括Google在内的大部分常用搜索引擎更宠爱UTF-8编码的robots.txt文件。

相关文章:有道关于robots.txt的解释

Robots.txt这个文件相信大家都不模式吧,是搜索引擎中访问网站的时候要查看的第一个文件。Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。

当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。

robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。

语法:最简单的 robots.txt 文件使用两条规则:

• User-Agent: 适用下列规则的漫游器
• Disallow: 要拦截的网页

Robots.txt是一种存放于网站根目录下的ASCII编码的文本文件,Robots.txt的文件名应统一为小写,即robots.txt。

Robots.txt协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。注意Robots.txt是用字符串比较来确定是否获取URL,所以目录末尾有和没有斜杠“/”这两种表示是不同的URL,也不能用”Disallow: .gif”这样的通配符。

因为robots.txt是一个纯文本文件,所以很多站长在设置网站的这个文件时,随便把系统中过的文本编辑器拿来就写了,然后上传到自己的网站根目录,以为这样就万事大吉了,其实,你只做了一半因为你的马虎。

已经被无数站长证实的事实是:搜索引擎更喜欢UTF-8编码的robots.txt文件。Google Groups成员Phil Payne也是为此做出声明说:在常用的HTML文件编码类型中,Google和其他的搜索引擎都更偏爱UTF-8编码的robots.txt文件。甚至有的文件编码形式都已经被Google直接忽略掉了。

所以请问,你网站根目录下的robots.txt文件是UTF-8编码吗?如果不是,建议你修改为该编码。

更多精彩内容其他人还在看

SEO常犯的一些错误及改善建议

在网站SEO工作过程中,也许你会犯一些错误,其实这很正常,不过如果你发现不了,或者不及时改善,那后果就会很严重,看看这篇文章给出的建议
收藏 0 赞 0 分享

网站外链出现的问题及解决方法

网站外链问题一直困扰的站长的一大问题,看看这篇文章是如何用实例来讲述的出现问题并如何解决的
收藏 0 赞 0 分享

百度聚合搜索对于相关性搜索结果页面是如何判断的

对于百度聚合搜索对于相关性搜索结果页面是如何判断的这个问题,该文有详细的解答,希望分享给大家
收藏 0 赞 0 分享

企业站SEO优化几大误区是什么

企业网站优化越来越被企业重视,在seo工作过程中,有些误区一定要注意,看看本文给出的一些建议
收藏 0 赞 0 分享

网站SEO中怎么做好用户体验

做好用户体验,其实不光是对网站本身有好处,对用户有好处,对搜索引擎也有好处,看看本文给出的观点,分享给大家
收藏 0 赞 0 分享

搜索引擎判断文章是否为原创的方法是什么

虽然知道原创文章的重要性,但是大家也都知道,一篇两篇原创文章没有什么大问题,如果长久的保持网站文章的原创那是一件非常艰难的事情,那怎么做呢?下文给出的分析分享给大家
收藏 0 赞 0 分享

网站优化之看糗事百科也能学好SEO

看看糗事百科,可以让自己轻松休闲,哈哈大笑。把一天的疲惫以扫而光;还可以补脑,长姿势。不信,看看下文
收藏 0 赞 0 分享

怎么做好论坛的外部链接建设?

通过论坛可以为自己需要推广的网站提供优秀的外部链接,论坛的外部链接建设主要重点就应该放在发布内容的策划、论坛账户的维护上,如何做到?请看下文
收藏 0 赞 0 分享

怎么运营中小独立B2C商城网站

有部分中小企业老板没有去做平台,而是运营着独立的B2C商城网站。如何运营好独立的B2C商城网站呢?看看下文,分享给有需要的朋友
收藏 0 赞 0 分享

网站SEO中复制内容的判定标准和建议

网站seo中,如何去处理复制的内容不同的站长方法不同,看看这篇文章的作者是可以给出什么标准和建议,分享给大家,希望可以给大家以启发
收藏 0 赞 0 分享
查看更多