SEO案例分析 alimama做SEO引流量的方法

所属分类: 网站运营 / 网站优化 阅读数: 108
收藏 0 赞 0 分享

07年以前的阿里巴巴,经过几年的努力,已经把SEO做到了一个很高的境界。当时领导SEO团队的人员是做技术出身,所以大家大量借助技术手段来分析和解决SEO当中出现的很多问题,取得了很好的效果。因为涉及到现有的业务,只能说几个不那么敏感的例子。

Google 网站管理员工具刚出来的时候,我们网站有很多频道都验证不了那个google需要你上传的文件。工程师那边帮助查了很多问题,以为是什么跳转之类的没有做好。查了很多资料,也没有找到特征吻合的相关解决办法。而meta验证的方法因为技术上有一点问题做不了。所以我们SEO团队就帮工程师去找问题。我同事瞿波不一会就找出问题出在什么地方了,原来问题出在泛解析上。

具体的过程是这样的:

用了泛解析的url,无论你把url组合成一个什么样子,都会有一个正常的页面给你的。比如:如果你网站的根目录下用了泛解析,http://www.xxxxxx.com/a.html 这个url是你网站本来正常的url。那么你随意的输入一个本来不存在的url 如 http://www.xxxxxx.com/adasdsadw.html 甚至 http://www.xxxxxx.com/@####¥¥.html ,网站CMS返回的都是一个正常的页面。

这在一个大型网站中,很多地方出于业务需要,都是这么处理的。但是这样做,在“网站管理员工具”的验证方面就一定不能通过。为什么呢?

因为这样谁都可以把这个网站加到自己的网站管理员工具中。而实际上这样的情况是不会发生的,因为google不光会验证你上传的文件存不存在,还会验证一个不应该存在的文件是不是不存在。google验证完你上传的文件后,接着会模拟一个叫做 google404errorpage.html 的页面是不是不存在。google觉得你网站根目录下恰好存在一个名叫google404errorpage.html的几率是零,所以如果检测下来发现你这个页面也存在的话,那就不能验证通过。google这个时候已经知道你这是因为泛解析导致的缘故。出于保护你的网站,google不会让这个验证通过。

上面的这个分析过程,在公开的渠道里是找不到的。现在在《google网站质量指南》里也只是让你给不存在的页面返回 4xx 状态码而已。http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=35638,而且这个规则也是最近加进去的。以前,根本找不到相关的资料来参考。那我的同事为什么一下子就找到问题在哪里了呢?那是因为服务器的log日志里一定会记录google验证的这个过程的,把相关目录下、某个时间段的log日志调出来查看就可以看到了。

如果没有LOG日志分析,谁能想得到还有这么一个过程在里面呢? 至今,还有很多网站验证不了这个文件的,现在就可以看看有没有这个泛解析的问题,或者去分析log日志看看。还有一次,网站改版后,网站流量骤然下降了。我们知道影响SEO流量的因素有很多,那到底是什么原因导致流量下降呢。我以前的主管BEN通过自己的分析,觉得是url出了问题。

当时的url是这样的: http://www.alibaba.com/bin/buyoffer/mp3.html,我想很多人都不会觉得这个url有什么异常。但是在当时,这个url有一个致命问题的。

在02年google的爬虫还不是很成熟的时候,为了避免陷入死循环,爬虫不光会对那些有多余参数的url抓取量减少,还会对某些特定的目录不抓取的。这样的目录中,就有 /cgi-bin/ 以及类似的 /bin/ 这样的目录。学过CGI语言的人都知道,/cgi-bin/这个目录下是放置cgi程序的地方,这种目录下进行抓取是没什么意义的。/bin/这个目录也是其他很多系统或者语言默认的文件夹名称,这些目录下都不存在google应该抓取的页面,所以搜索引擎就屏蔽了这样的目录抓取。而偏偏我们定义的文件夹名称就是/bin/,google是不会抓取这个目录的。

之后,把这个目录名称改为/trade/,流量马上就恢复了。如今,百度也在robots文件的用法中,就拿/cgi-bin/这个目录做了例举。 http://www.baidu.com/search/robots.html,我相信这样的问题即使放到现在,也没有人敢怀疑是google本身出了问题。有些人还会从上百个因素里找一个看似很合理的原因,导致真正的原因被掩盖了。但是ben通过技术分析并实践,却得出了让人信服的结论。类似的事情,我后来也碰到过好几回,因为有他们的经验在鼓舞我,使我也做了一些让别人不能理解,但是却给网站带来很大流量的事情。

技术分析在和竞争对手抢流量的时候,也是竞争力之一。举一个不那么恰当的例子:

sitemap.xml刚出来的时候。我们自己制作好了sitemap.xml文件,但是毕竟这么大型的sitemap文件谁也没有做过,特别是里面权重的设置在一个大型网站来说是很有讲究的。所以我们就想参考一个国外主要竞争对手的文件。一开始通过一个方法拿到了他们的文件地址,但是怎么也打不开那个链接,老是返回404错误。通过国外的代理服务器去访问也是这样。最后,通过模拟google爬虫才能正常的访问这个文件。 原来同样非常重视SEO的这个对手,为了让自己的sitemap.xml文件不被其他人看到,只有对那种user-agent是google爬虫的访问才显示这个文件,由于浏览器的user-agent是很容易判断出来的,就拦截掉了浏览器的访问。

《怎么样去学SEO》一文,讲述了学SEO要从了解网站和搜索引擎相关的技术开始。而这篇文章就是让大家看看具体是如何应用的。阿里巴巴最早做SEO的那批人,早在国内还不知道SEO是什么的时候就已经涉及到了诸多技术问题,并马上取得压倒性的优势。虽然现在他们因为某些原因都没有在做SEO了,但是他们给网站的贡献是非常大的。我个人的观点: 从某方面来说,是SEO成就了alibaba。

更多精彩内容其他人还在看

SEO需要了解哪些技术

做SEO并不是一件简单的情况,那么,SEO需要了解哪些技术?需要了解技术吗?针对这些问题,本文就为大家进行简单接单
收藏 0 赞 0 分享

网页标题是一成不变的吗 如果修改了会影响到网站排名吗

谈到网站的优化,很少人会对网页标题动心思,究其原因,还是因为担心如果修改了网页标题会影响到网站排名,那么,网页标题是一成不变的吗?如果修改了会影响到网站排名吗?对此,本文就为大家进行解答
收藏 0 赞 0 分享

网站跳出率怎么减少?降低网站跳出率高的9种技巧介绍

网站访问量及跳出率可以直观的看出网站优化的效果,那么,网站跳出率过高怎么办?是什么原因造成的呢?对此,本文就为大家进行简单解答
收藏 0 赞 0 分享

手机网站优化技巧有哪些

作为互联网新生代的一个新启之星手机网站,它的存在大大的便利了人们的生活,那么,手机网站怎么优化呢?针对这一问题,本文就为大家简单介绍下手机网站优化技巧
收藏 0 赞 0 分享

新站如何被百度快速收录

新网站如何快速收录对于网站的收录来说不在乎网站的时间长短,新站难免会出现一些迟迟不会被搜索引擎收录的现象,那么,新站如何被百度快速收录呢?本文就为大家进行简单解答
收藏 0 赞 0 分享

SEO中哪些手段是最高效的?

网站运营时SEO是比可少的技术之一,那么,SEO中哪些手段是最高效的?针对这类问题,本文就为大家进行简单解答
收藏 0 赞 0 分享

SEO新手们经常会碰到的6个问题

随着近几年互联网的迅猛发展,SEO这项技能被越来越多的企业认可,刚接触SEO的站长们总是会碰到各种各样的问题,本文主要为大家简单介绍下SEO新手们经常会碰到的6个问题
收藏 0 赞 0 分享

网站关键词怎么查询百度排名及历史排名?

网站关键词怎么查询百度排名及历史排名?想要做好优化就要了解关键词的排名情况,该怎么查看关几次在百度的现有排名以及历史排名?下面我们就来看看详细的教程,需要的朋友可以参考下
收藏 0 赞 0 分享

新浪博客如何SEO优化排名?

如何利用新浪博客做好SEO优化?新浪博客作为多数站长发外链时的首选平台具备以下特点,易收录,权重高,流量大等等,但是如何利用好这几个优势把网站关键词排名做的更好呢?下面,曾庆平SEO就为大家讲一下如何利用新浪博客做好SEO优化的问题
收藏 0 赞 0 分享

为什么网站关键词排名上去了却没有流量?

为什么网站关键词有排名却没有流量?相信这是绝大部分站长都会碰到的问题,辛辛苦苦把关键词排名做上来,但却没有流量,更别谈什么转化率。出现这种情况我们应该如何处理,针对这类问题,本文小编就为大家进行简单解答
收藏 0 赞 0 分享
查看更多