URL地址反映出网站的蛛丝马迹

所属分类: 网站运营 / 建站经验 阅读数: 81
收藏 0 赞 0 分享

我喜欢浏览网页时多个心眼。这个心眼需要观察许多元素,每个元素都能提供信息。孤立的一个元素不重要,但是多个元素组成的信息,往往能获得有价值的判断。那么从这些元素说起:

永远不忽略URL
URL是一个重要的信息,职业敏感让分析师绝对不会忽略URL地址的特点。URL反映出网站的蛛丝马迹,直接以例子说话:

$URL地址所在的域名
很多人在网上被骗,很大原因就是从来不关注URL所在的域名。

比如:http://www.taobao.ipx32.com/about.html,看似弱智的骗术却让很多网友 误以为是淘宝的网站而落入圈套。这是ipx32域的网站,而不是taobao的网站。
在浏览的过程中,时刻关注页面的URL域名,可以知道点击链接是否离开本站,而关注新到的站点域名有何特征。在许多大客户的营销过程中,跨域的链接是很常 见的,不同的域意味着站长或广告主的监测工具与策略也会有所不同。

比如:在IT门户中常有Intel,华硕,HP等硬件厂商的专题页面(可能会添加Google Analytics或Nielsen的监测代码),这些页面中会有链接将访问者导入新的域名,如intel.com.cn,或者hp.com.cn(可能 会添加Omniture、HBX或Webtrends的监测代码)。这种跨域的URL是显而易见的。


$ URL地址所包含的参数


URL中包含参数是再常见不过了,但每个参数都有含义,关注它们能够全面掌握网站的功能特点。比如:


http://www.chinawebanalytics.cn/?p=917 这是Sidney的新博客的地址,可以分析这个博客运营了挺长的一段时间了,ID号都排到917了。

http://adsclick.qq.com/adsclick?oid=1112901&loc=QQ_SX_JY_Test6&url=http://www.52-abc.com/这是QQ首页的右侧广告链接,里面丰富的参数告诉了我们对这些广告位的名称定义,以及跳转的目标地址。

http://www.soso.com/q?sp=S&sc=web&cid=w.q.in.sb.web&ty=1&bn=&op=entry&kw=&w=WA 这是腾讯搜搜的“WA”结果页,告诉我们搜索关键词参数是用W变量。还有一些别的参数,也许一下子看不懂,如果有需要可再多次试验研究,就可以确定。


总之,对URL的参数关注是分析师的基本功。


$ URL地址所指向的文件类型


URL中会包括文件类型的信息。


HTML/HTM:这说明这种网站的页面是经过静态化处理的,以方便搜索引擎抓取。现在大部分门户与CMS系 统都会有静态化处理功能。再有一些简单的个人网页也会使用html文件名。

JSP/PHP/ASPX/ASP:这说明这是一种动态页面,网页源文件是存在服务器端,这些文件的特性可自 行搜索了解。

无类型:有些地址,http://www.ectend.com,这是属于服务器 自定义了主页,效果其实是http://www.ectend.com/index.php

.do:http://www.ems.com.cn/qcgzOutQueryAction.do?reqCode=gotoSearch 这种情况是jsp开发的网站。其实不需要完全知道,能辅助即可。这种网站一般有一定的技术含量,但技术实力不强,不够先进,常见于一些国资背景企业的功能 型网页,或者网站的后台。因为时下好的网站,在前端页面都能将URL隐藏得很好,不会出现.do这种情况。

另外:还有一些开源项目的网站URL地址比较特别,如Wordpress:http://www.ectend.com/index.php/excellent-analytics/; 或 Wikipedia:http://zh.wikipedia.org/wiki/Wikipedia:首页。


$ URL地址命名的特征


从URL的命名也能发现蹊跷或有趣的事,比如:

 


淘宝的URL特征就很有意思,是通过base 64编码的。(感谢money的指点,修正原来错误,很有收获,再次说明URL里有乾坤),很 多“-”。我推测“–”之间代表着变量,如果中间没有值,就代表这个变量没有定义。
http://list.taobao.com/browse/50018957-50018960/n-1-1---------------------0---------yes---------------------2-------b--40--commend-0-all-50018960.htm?ssid=r18?ad_id=&am_id=&cm_id=&pm_id=

凡客诚品的URL也很有特色:
http://www.vancl.com/Product_1E10000/RuanNiuPiXiDaiXiuXianXie+HeiSe.html, 产品拼音+颜色。

另外还能找出他们员工粗心之处:我们知道中文括号()与英文括号()不同,URL地址中只能出现英文括号,中文括号会翻译成编码。可见Vancl 的员工在产品录入时没有统一标准:
http://www.vancl.com/CategoryList-1440-1--1/GaoJiMianTangQuanMianChenShan%EF%BC%88ZunGuiKuan%EF%BC%89.html
http://www.vancl.com/CategoryList-1324-1--1/ShangWuXiuXianKu(BiaoZhunKuan).html


网页源文件


对于好奇的网页,一定要查看网页源文件。通过源文件的快速浏览能够确定网站的技术实力、设计人员的素质,监测工具与监测方法的部署情况。一般关注以 下四点:


代码是否干净还是冗烦

部署了哪些监测工具

监测工具的代码部署的位置与顺序

是否加入了可疑代码

更多精彩内容其他人还在看

美国Inmotion主机的购买及续费教程

这篇文章主要介绍了美国Inmotion主机的购买及续费教程,90天内无条件全额退款是Inmotion Hosting最为著名的一大特色,需要的朋友可以参考下
收藏 0 赞 0 分享

网站建立前怎么办?企业网站建立前本身有哪些问题被忽略?

网站是需要运营的,在运营过程中有一个重要的点就是营销,而网站的营销大多数朋友采用的就是竞价或者优化。那么网站建立前怎么办?企业网站建立前本身有哪些问题被忽略?下面我们就来看看吧
收藏 0 赞 0 分享

移动端网站页面调试的一些经验分享

这篇文章主要介绍了移动端网站页面调试的一些经验分享,包括远程调试以及针对iOS和Android平台的具体调试方法,干货十足,需要的朋友可以参考下
收藏 0 赞 0 分享

使用Google CDN导致网站页面无法加载的问题解决

这篇文章主要介绍了使用Google CDN导致网站页面无法加载的问题解决,由于谷歌在国内的访问原因,使得很多内置使用Google CDN的产品影响网站的访问,需要的朋友可以参考下
收藏 0 赞 0 分享

网站如何进行改版更好些 网站改版注意事项详情解答

为了应对客户的需求和当下网友们的审美观,很多网站都会在后期进行改版,网站改版期如果做的不过,那么对整个网站就是伤筋动骨的大事了,那么,如何进行网站改版?以及网站改版需要注意哪些事情呢?对此,本文小编就为大家介绍网站改版的详细注意事项
收藏 0 赞 0 分享

美国Hostigation的VPS主机购买管理及评测完全攻略

这篇文章主要介绍了美国Hostigation的VPS主机购买管理及评测完全攻略,Hostigation中用户可以选择KVM或者OpenVZ虚拟机下的服务器,这一点比较难得,需要的朋友可以参考下
收藏 0 赞 0 分享

网站分类目录的赚钱模式有哪些?网站分类目录站点的五种盈利模式分析

近些年网站分类目录站点很受个人建站喜欢,主要因为运营维护不需要花费太大精力,推广简单,外链自然增长,PR值很容易提升,还有盈利渠道简单多样等等,那么网站分类目录的赚钱模式有哪些?本文提供网站分类目录站点的五种盈利模式分析供大家了解,希望对大家有所帮助
收藏 0 赞 0 分享

知乎社区如何保持用户高粘性?

知乎是一个真实的网络问答社区,帮助你寻找答案,分享知识,当下知乎已经从一个小众的极客社区成长为了拥有1700万注册用户的庞大社区,那么知乎是如何做到这些的呢?下面就分析一下
收藏 0 赞 0 分享

如何购买模板?防范购买模板上当受骗的几个方面

于是很多站长开始选择第三条路,那就是购买一些定制化的模板,可是不幸的是,这些采购者往往会遭遇各种各样的陷阱,有些所谓的个性化模板已经被很多人倒转了几手,而且内部还存在着很多的缺陷,买回来也难以使用。所以为了防范自己上当受骗,就需要从下面几个方面来防范
收藏 0 赞 0 分享

简单总结Hadoop和Spark集群技术的不同点

这篇文章主要介绍了简单总结Hadoop和Spark集群技术的不同点,一般情况下人们普遍认为Spark的性能要比Hadoop好很多,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多