排名难页面不收录什么原因?网站存在抓取错误的解决方法

所属分类: 网站运营 / 网站优化 阅读数: 78
收藏 0 赞 0 分享

  不抓取如何会收录,又怎么有排名?然而就这样一个明显的问题,却有大量的网站将其忽略掉。在A5这里做SEO诊断服务的客户中,其中“20%”的网站都会存在抓取错误,直接严重影响到网站的成长效果。今天这篇文章,如果你有幸看到,希望可以阅读完今天这篇文章,并分享出去,因为真的会很有价值。

  贺贵江:曾经诊断过一个千万级别收录的站点,但是索引总是被反复的剔除,又反复的收录,企业一直找不到问题。可是当我们对网站检查之初就发现一个怪的现象了:

  1、错误的封禁

  在百度的robots.txt的更新上,如果多次点击“检测并更新”就会出现时常可以更新,但是又时常无法更新的问题。如此一来:不应当被收录的东西,在robots.txt上禁止的被收录了,又删除就很正常了。那么它的问题是什么呢?并非服务器负载过度,而是因为防火墙错误的将部分Baiduspider列入了黑名单。

  上面这个例子是robots.txt方面的抓取错误,作为站长最少应该每周都检查更新一下robots.txt是否可以正常更新。之后我们再看下“页面抓取”方面的错误:

  2、服务器异常

  常规的服务器就不说啦,大家都知道的,北上广的一般都不错。不过有一些特殊服务器,想必绝大多数的站长都不知道吧?例如西部数码的“港台服务器”就很有趣,真的是港台的吗?本身机房在国内,还算什么港台?为了逃避备案而用一个港台的IP,数据全部在国内。

  这样有什么不好呢?我们会发现:站点的服务器是经过CDN的,哪怕是你上传的一张图片,都会显示为“302状态码”,访问速度是提升上去了,可是这样利于SEO吗?呵呵哒。真不知道西数做为国内大型idc服务商是如何想的,利用那些无知吗?

  3、获取不到真实IP

  规模较大的网站,一般都会使用CDN加速,但是有些站点不仅仅对“设备”使用了CDN加速,而且还对Spider使用了加速功能。最后的结果是什么呢?如果CDN节点不稳定,那么对网站spider来讲,这个问题将是致命的。

  很多大型站点开放CDN的原因就是容易被攻击,这个时候如果不做“蜘蛛回源”就可想而知了。你的站点做了CDN了吗?请登录百度站长平台查看一下spider是否可以抓取真实IP地址吧!

  4、频繁的50X类错误

  这样的链接其中一个共同的特点是:当打开后,全部都是正常的,那么Spider为什么会报错提醒呢?只是因为在爬虫发起抓取的那一刻,httpcode返回了5XX",你的站点是否频繁有这样的问题呢?有的话需要立即安排技术,或者通报IDC服务商做解决了!

  5、错误的抓取比例

  任何网站都做不到100%不出问题,但是万事有一个度:我们认为,这个比例不超过5%,对网站基本上是无影响的,且这样的错误不应当每天都出现。最常见的抓取错误一般都是连接超时:"抓取请求连接建立后,下载页面速度过慢,导致超时,可能原因服务器过载,带宽不足"这种情况:

  A:尽量在不影响图片质量的情况下,对图片进行压缩,上传的时候就进行了压缩。

  B:减少如JS脚本文件类型的使用,或者进行合并

  C:页面大小进行控制,尤其是一些浏览量、抓取量较高的页面,不建议超过2MB。

  D:增加网站的带宽,提升下载速度,或者更换服务器。

  今天这篇分享,是否对你有帮助呢?希望能对大家有所帮助!

更多精彩内容其他人还在看

网站优化必知:搜索引擎都重视原创的三大理由

作为一个优化人员应该知道原创是搜索引擎最重视的,想要做好网站,原创是必不可少的,那么,搜素引擎重视原创的理由是什么呢?
收藏 0 赞 0 分享

seo优化 获得高质量反向链接的方法

作为一名优化人员,我们都知道优化的时候是内容为王,外链为皇,说明外链对于优化来说也是非常重要的,那我们怎样才能获得高质量的反向链接呢?小编整理了几个获得高质量反向链接的方法,一起来看一下吧
收藏 0 赞 0 分享

新站必须要注意的一些关键点 才能稳定长久

在前期选取关键词时,尽量选用指数较小的关键词进行部署,由小词换大词,这样让网站有一个过渡期,就会可以很好的使网站稳定提升。下面为大家介绍新站必须要注意的一些关键点,来看看吧
收藏 0 赞 0 分享

如何做好网站运营呢?

网站不能主导市场,如果你实体店做的不咋地,网站就有可能一样带不来多少业务,尤其当市场上只需要一家的时候,有没有网站都很难改变这个趋势,那么如何做好网站运营呢?下面我们来看看吧
收藏 0 赞 0 分享

SEO常用到好用的工具有哪些?

做网站优化的一个瓶颈是SEO的自动化。到目前为止,绝大部分网站优化工作还得是人工去做。一些SEO工具可以辅助,但还没办法取代人工操作
收藏 0 赞 0 分享

大公司和小公司的产品推广方式有什么区别

在百度这样的大平台,获取流量和用户相对容易很多。我记得一个webapp的推广位,每天就能带来8K-12K的新增激活,像这样的位置至少有3-4个,虽然不同位置的量级大小不同,但每天2-3W的新增激活是很容易做到的,而且这只是我遇到的情况。
收藏 0 赞 0 分享

SEO优化的思维有哪些惯性陷井?

往往我们都会习惯性的分析网站的流量、查看网站的排名、网站的历史操作、现任的网站问题等等一系列状况,这对于大部份SEO来说这是习惯性的操作,但是这种习惯往往会潜伏着一个比较危险的信号,这个信号是隐藏,详情我们来看看吧
收藏 0 赞 0 分享

网站建设有哪些比较好的代码优化?

众所周知,现如今从搜索引擎的角度出发,我们都提倡使用div+css来布局网站,以此来更好的贴合搜索引擎的抓取习惯,但现在有一部分站长在网站建设中依然使用table来布局页面,下面小编就为大家介绍网站建设的代码优化,来看看吧
收藏 0 赞 0 分享

浅谈网站排名和文章的逻辑关系

对于搜索引擎的算,多数朋友都不会陌生,就像百度经历了链接投票算法、点击算法、到如今内容原创保护、和打击作弊等等各种算法,下面为大家浅谈网站排名和文章的逻辑关系,来看看吧
收藏 0 赞 0 分享

如何将优化做好?7天快速排名的基础SEO优化

如果网站的刚开始排名就不好那就要从自身的小细节做起了,所以大家一定要把基础优化做好,如何把一个行业地区词(郑州律师事务所)优化到前20名的,今天说的就是关于快速排名的基础优化的东西
收藏 0 赞 0 分享
查看更多