百度蜘蛛抓取时返回304状态码的问题分析

所属分类: 网站运营 / 网站优化 阅读数: 188
收藏 0 赞 0 分享
最近遇到一个网站被百度蜘蛛抓取首页后大量返回304状态码的问题,以前遇到过301和302,就是没了解过304,刚好可以对这个情况进行一下分析和观察,以便比较深入的了解该问题的出现以及应对之策。
SEO:百度蜘蛛304状态码的问题分析
百度百科对304状态码是这么解释的:如果客户端发送了一个带条件的 GET 请求且该请求已被允许,而文档的内容(自上次访问以来或者根据请求的条件)并没有改变,则服务器应当返回这个304状态码。简单的表达就是:客户端已经执 行了GET,但文件未变化,也就是我们所理解的页面没更新。
GET /index.html - 80 - 220.181.135.120 Sosospider+(+http://help.soso.com/webspider.htm) 304 0 0
GET /index.html - 80 - 123.129.209.113 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) 304 0 0
但网站每天都有较多内容的更新,怎么会返回未更新的状态码呢,查看了网站进几天的网站IIS日志,发现这几天对首页的抓取都是返回的304状态码,一般情况下大概会是一下几种可能:
1、服务器缓存缘故
设置缓存的作用一般都是为了加速网站的提前加载,就像我们在浏览器上访问网站的时候也比较容易出现缓存问题,当你打开一个网站之后,如果该网站有更新或者有 变化,直接点击首页会发现还是之前访问的页面,而ctrl+F5重新加载后才会显示新的页面,这其实就是缓存的缘故。另外,有的时候和一些较大的网站换友情链接也会遇到,对方加了友链之后首页不会马上显示,会因为缓存而需要过一段时间才能显示。
2、网站结构问题
如果网站结构不能有效的让蜘蛛顺利爬行,也就是说虽然蜘蛛有抓取,但由于网站结构问题导致蜘蛛前后两次抓取内容相同,或者说蜘蛛每次抓取首页都只抓了那块固定的内容,那么就势必导致蜘蛛对首页的抓取返回304状态码。
3、网站速度问题
谷歌就针对网站的加载时间更 新过算法,把网站加载时间纳入了排名因素,就算搜索引擎排名不重视这点,对于用户体验也是有很大影响,谁也不会愿意多花时间在一个需要加载几十秒甚至几分 钟的网站上面。而对于搜索蜘蛛也是如此,网站的加载速度也会影响蜘蛛的正常抓取,一般情况下网站都是从上往下的加载,而有的时候由于速度因素导致网站只加载了头部,后面部分而没有及时显示出来,也可能导致蜘蛛只抓取了头部部分内容,而由于一般网站的头部都是相同的,也就容易出现了抓取返回没更新的状态码。
另外,网络线路的互通也是一个因素。
4、网站内容问题
网上查找了下关于304状态码的一些内容,不少人都认为是网站内容长期采集或是伪原创也能导致蜘蛛返回该状态码,因为网站内容采集或伪原创的确会降低网站质量,导致百度不收录等情况,搜索蜘蛛也会认为网站内容不具备收录的意义,那么也就不会抓取新的内容而返回没有更新的状态。
5、重视该状态码
既然304状态码是表示未更新的情况,那么经常出现就需要引起重视,同时也需要观察出现该状态码的同时网站各方面数据的变化和趋势,以便对该状态码的影响有较好的了解。
暂时网站出现304状态码之后经过百度更新收录有所减少,前几天有过断断续续的网站无法访问的情况,第二天网站首页就被K掉,在更换服务器之后恢复网站正常访问,次日首页再次恢复,目前仍需要观察和分析,才能更好掌握该状态码。
更多精彩内容其他人还在看

SEO新站点nofollow标签的妙用

Nofollow是最早由Google领头新创的一个标签,目的是尽量减少垃圾链接对搜索引擎的影响。近日有网友咨询nofollow标签怎么用?今天我们就来看看SEO新站点nofollow标签的妙用有哪些
收藏 0 赞 0 分享

针对SEO所必备的搜索引擎工作原理知识

这篇文章主要介绍了针对SEO所必备的搜索引擎工作原理知识,简单地讲解了搜索引擎处理数据的一般流程,帮助SEO者针对搜索网站进行相关优化,需要的朋友可以参考下
收藏 0 赞 0 分享

网站为何被降权?网站降权诊断分析以及恢复排名操作

网站降权是指搜索引擎对网站评定的级别下降,是搜索引擎对网站进行的一种处罚方式,导致网站整体排名下降,但通常多为网站自身作弊导致的,改正错误一段时间后会自行恢复,本文将提供网站降权诊断分析以及恢复排名操作供大家了解,希望对大家有所帮助和启发
收藏 0 赞 0 分享

网站SEO优化最容易进入的四个误区

我们发现一个网站经常优化过后排行和收录还是不好,今天我们就用一个广告衫网站seo的几个错误点作为实例,来个大家分析网站SEO优化绝对不能进入的误区,需要的朋友可以参考下
收藏 0 赞 0 分享

SEO友情链接交换技巧 专业SEO交换友情链接必须要知道的一些SEO知识

友情链接是网站和网站之间优势互补的一种比较便捷的合作形式,其操作形式是分别在自己的网站上放置对方网站的LOGO链接或锚文本链接,这样可以达到互相推广的目的,因此常作为一种网站推广最基本手段
收藏 0 赞 0 分享

网站不收录的因素有哪些 如何注意

常常会有人问到网站为什么不收录,网站为什么收录这么少的问题,其实网站的收录并不与排名有直接的联系,那么本文来分析网站不收录的因素有哪些,感兴趣的小伙伴们可以参考一下
收藏 0 赞 0 分享

新手必读:百度下拉框暗藏的SEO技巧

随着百度算法的调整,搜索引擎的宗旨就越来越明显,“客户体验度”自然被很多站长摆在桌面,那么作为一个SEO人员,百度下拉框暗藏什么SEO秘诀呢?本文将提供相关内容供大家了解,希望对大家有所帮助和启发
收藏 0 赞 0 分享

如何挖掘网站长尾关键词?58同城seo优化解析详解

一个网站想要获得海量的流量,就一定要懂得做长尾关键词的排名优化。那么什么是长尾关键词呢?如何挖掘网站长尾关键词?本文将提供58同城seo优化解析详解供大家了解,希望对大家有所帮助和启发
收藏 0 赞 0 分享

营销技巧:如何做到半年不更新文章和发布外链都能稳定排名

刚刚接触营销知识的时候,完全不知道营销知识和SEO有半毛钱关系,但很多排名大咖都是靠营销结合SEO进行操作,有时候就纳闷了,为何人家半年不更新一篇文章,每天流量爆满,本文将提供相关经验供大家了解,希望对大家有所帮助和启发
收藏 0 赞 0 分享

安全宝CDN加速服务的配置和使用攻略

这篇文章主要介绍了安全宝的CDN加速服务的配置和使用攻略,文中还讲到了安全宝的防盗链和云web防火墙等附加功能,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多