搜索引擎喜欢UTF-8编码robots.txt

所属分类: 网站运营 / 网站优化 阅读数: 1458
收藏 0 赞 0 分享

所以请问,你网站根目录下的robots.txt文件是UTF-8编码吗?如果不是,建议你修改为该编码。

Google Groups成员指出包括Google在内的大部分常用搜索引擎更宠爱UTF-8编码的robots.txt文件。

相关文章:有道关于robots.txt的解释

Robots.txt这个文件相信大家都不模式吧,是搜索引擎中访问网站的时候要查看的第一个文件。Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。

当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。

robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。

语法:最简单的 robots.txt 文件使用两条规则:

• User-Agent: 适用下列规则的漫游器
• Disallow: 要拦截的网页

Robots.txt是一种存放于网站根目录下的ASCII编码的文本文件,Robots.txt的文件名应统一为小写,即robots.txt。

Robots.txt协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。注意Robots.txt是用字符串比较来确定是否获取URL,所以目录末尾有和没有斜杠“/”这两种表示是不同的URL,也不能用”Disallow: .gif”这样的通配符。

因为robots.txt是一个纯文本文件,所以很多站长在设置网站的这个文件时,随便把系统中过的文本编辑器拿来就写了,然后上传到自己的网站根目录,以为这样就万事大吉了,其实,你只做了一半因为你的马虎。

已经被无数站长证实的事实是:搜索引擎更喜欢UTF-8编码的robots.txt文件。Google Groups成员Phil Payne也是为此做出声明说:在常用的HTML文件编码类型中,Google和其他的搜索引擎都更偏爱UTF-8编码的robots.txt文件。甚至有的文件编码形式都已经被Google直接忽略掉了。

所以请问,你网站根目录下的robots.txt文件是UTF-8编码吗?如果不是,建议你修改为该编码。

更多精彩内容其他人还在看

Google发布网页统计报告 网站优化4点建议

Google发布了网页统计报告,此举是为了提高大家对网页读取速度优化的重视程度,他们为网页开发者提供了很多帮助指南,来提高效率。
收藏 0 赞 0 分享

SEO报价单参考 关键词的热度评定和报价方案

seo网站优化方案的价格视网站经营目标、网站的规模、功能、结构、内容、行业网络竞争状况等具体状况而定,一般为2000元-10万元之间。
收藏 0 赞 0 分享

seo报价方案关键字的五个参考

seo报价方案关键字五个参考,对于做seo优化的朋友会有些帮助。了解行情。避免恶意竞争。
收藏 0 赞 0 分享

百度降权的几种情况分析

百度降权对大多站长来说,是很恐怖的事情,产品排名消失,收录大量减少,快照停止更新,更严重被把毛,这些都是朋友们不想看到的结果
收藏 0 赞 0 分享

SEO 最简单的方法往往是最有效的

在SEO行业呆的越久,就越能明白一个道理,那就是:“SEO的真谛是简单的方法不断的加强”
收藏 0 赞 0 分享

网站优化之避免冗余代码 记事本在网站优化中的作用

当我们接手一个客户网站后,首先会对网站进行全面的体检,你就会发现网站产品页的垃圾代码相当多,大约占了有用代码的一半,这无疑不利于SEO(不利于搜索引擎抓取),几乎每一个网页都一样。这种网页是怎么产生的呢?
收藏 0 赞 0 分享

百度删除网站收录内容解决方法小结

为什么百度收录了我的内容页,过后又删除?
收藏 0 赞 0 分享

SEO的真正的命脉所在网站的整体质量

网站的整体质量才是SEO的真正的命脉所在
收藏 0 赞 0 分享

SEO 常见的作弊手法总结

常见的几种SEO作弊技术.尽量避免作弊,做好内容才是最重要的。
收藏 0 赞 0 分享

网络推广2条腿走路(技术+创意)

以前在刚刚接触网络营销的时候,总以为技术很重要。
收藏 0 赞 0 分享
查看更多