网站制作不可不知的URL知识

所属分类: 网站运营 / 建站经验 阅读数: 85
收藏 0 赞 0 分享
本文讲述URL这个司空见惯的Web元素中包含的大量不应为忽视的知识,准则与最佳实践。需要注意的是W3C建议使用URI取代URL一说。

关于URL的一些准则

首先是与URL有关的一些准则。

一个URL必须唯一地,永久地代表一个在线对象

URL的最基本的使命是唯一地代表Internet上的一个对象,URL必须和Internet上的对象一对一匹配。然而现实中,这很难实现,我们经常可以通过多个URL到达同一个页面,比如,http://mysite.com/product/tv和http://mysite.com/product?name=tv,这种情形在现代CMS中更是比比皆是,针对这个问题,SEO moz有一篇很好的文章,讲到了如何使用Canonical URL机制解决站点中的重复URL问题。

URL应该是永久的,这就要求你在站点上线前就非常严谨地规划URL。如果有一天,你不得不更改URL,一定使用HTTP301机制,告诉浏览器和搜索引擎,你的那个URL所代表的对象,已经搬迁到新地址,这个机制可以保证你旧地址所获得PR不会被清零。

尽可能用户友好

这是URL设计的根本,你的URL应该为最终用户而设计。保持URL友好的一个好办法是在保证可读性的同时让它尽可能短。比如/about就好过/about-acme-corp-page,当然,保持简短不能牺牲可读性,/13d2一类的地址短则短矣,但并不友好。如果要在Twitter,Facebook一类的社会媒体网络分享你的URL,可以使用Bit.ly一类的网址缩短工具,但这种工具产生的缩短URL并不友好,在Wordpress一类的CMS中,可以使用PrettyLink Pro或Short URL plugin一类的可控制的地址缩短插件。

 

URL的设计切忌使用一些对用户来说没有意义的内容,比如数据库的ID号,/products/23这样的URL地址对用户是极不友好的,应当使用/products/ballpoint-pen一类的地址。

保持一致性

站点内的所有URL必须保持一致的格式和结构,这样可以为用户带来信任感,如果你必须更改URL格式和结构,需要使用HTTP 301机制。

可预测的URL

这也是URL一致性的一个表现,如果你的URL拥有很好的一致性,用户可以根据URL猜测别的内容的URL,假如/events/2010/01指向2010年1月份的日程内容,那

/events/2009/01应当指向2009年1月的日程。

/events/2010应当指向2010年全年的日程。

/events/2010/01/21应当指向2010年1月21日的日程。

URL中的关键词

URL中应该包含本页重点内容的关键词,比如/posts/2010/07/02/trip-best-buy-memory-cards一类的URL本身就是对页面内容的反应。在URL包含重点内容关键词,也可以提高SEO性能。SEO的一个很重要的原则就是,在URL地址中包含内容关键词。

关于URL的技术细节

下面说的是有关URL的一些技术细节。

URL不应包含.html,aspx,cfm一类的后缀

这类信息对最终用户是没有意义的,却占了额外的空间,一个例外是.atom,.rss,.json一类的特殊地址,这类地址是有特别的意义的。译者注:在某些虚拟主机式Web服务器,这种做法未必现实。

URL不应包含WWW部分

WWW部分并不包含任何意义,是一个额外的负担,不友好。可以使用HTTP 301机制,将www.domain.com定向到domain.com。

URL的格式

URL的格式如下:

domain.com/[keyinformation]/[name]/?[modifiers]

Key information部分一般代表信息的类型或类别。Modifiers部分则属于查询字符串范畴,它不应当代表数据结构,应当代表数据的修饰。Key information部分应当尽可能简短,同时应当表现出一种层级关系,比如http://domain.com/posts/servers/nginx-ubuntu-10.04,或http://domain.com/news/tech/2007/11/05/google-announces-android。

Google News对新闻源有一个有趣的要求,Google要求新闻源页面的URL中必须包含至少3位唯一的数字,因为他们会忽略年份数字,因此,应该使用一个5位或5位以上的数字。另外,也应该提供Google News站点地图。如果你想向Google提供新闻,必须按这样的结构提供URL,当然保持一致性,可以预测性也是必需的。

使用小写字符

URL中所有字符都应使用小写,这更容易阅读。

URL中包含的行为元素

URL查询字符串中可能包含一些表示行为的元素,比如show,delete,edit等。非破坏性的行为可以体现在URL中,破坏性的行为应该使用POST。

使用URL友好字符

在URL中体现网页标题的时候,往往会用到一些特殊字符,应当把它们转换为URL友好字符:

全部大写字符换成小写

诸如é一类的字符应转换成对应的e

空格使用短划线代替

诸如!,@,#,$,%,^,&,*一类的字符应该使用短划线代替

双短划线应该使用单短划线代替

另外,没有必要的话,避免使用%20一类的URL逃逸符。

更多观点

Chris Shiflett建议,可以使用一些类似句子的URL,如:

 

chriscoyier.net/authored/digging-into-wordpress/
chriscoyier.net/has-worked-for/chatman-design/
chriscoyier.net/likes/trailer-park-boys
jacobwg.com/thinks/this-post/is/basically-done

 

译者补充:URL的长度上限

URL的最大长度是多少?W3C的HTTP协议并没有限定,然而,在实际应用中,经过试验,不同浏览器和Web服务器有不同的约定:

IE的URL长度上限是2083字节,其中纯路径部分不能超过2048字节。

Firefox浏览器的地址栏中超过65536字符后就不再显示。

Safari浏览器一致测试到80000字符还工作得好好的。

Opera浏览器测试到190000字符的时候,还正常工作。

Web服务器:

Apache Web服务器在接收到大约4000字符长的URL时候产生413 Entity Too Large"错误。

IIS默认接收的最大URL是16384字符。

更多精彩内容其他人还在看

打造成为优秀网站的10个技巧 推荐

每一个网站管理者都希望他们的网站是最好的。总有一个原因让他决定建立一个网站。但不管原因是什么,无论是出于商业目的还是为个人使用,创造一个令人印象深刻的网站始终是主要目标。
收藏 0 赞 0 分享

域名被别人备案了的注销方法

如果你发现自己的网站域名被别人备案了,可以按以下步骤撤销备案
收藏 0 赞 0 分享

降低网站被K的可能性 明晰网站优化的常见错误

搜索引擎优化很重要,也可以说是必不可少的东东,很多刚刚接触到SEO的朋友,在进行优化的操作上“不明白”或者“不清楚”,很容易出现操作错误,所以,就出现了被K的状况,有效的避免这些错误
收藏 0 赞 0 分享

国外windows主机要注意权限级别

最近要上一个.net的网站,而这个网站是采用xslt的,xslt中有使用到自定义脚本msxsl:script,但放到godaddy的服务器上去之后,却报出了黄页错误。
收藏 0 赞 0 分享

网站盈利不要在SEO的一棵树上吊死

无论你是做电子商务,写博客,操作一个企业网站或者是建个小站赚Google Adsense, 都可以找到相应的策略获得成功。当然成功是要通过大量实践得到的,不要只拘泥一种营销策略,只有多尝试才能知道哪几种对你的网站最有效。
收藏 0 赞 0 分享

注册资金难道创业者 互联网创业谈

创业者个个像愚公,当你决定去创业时,一推开门,面前就是一座座大山挡在了你前进的道路上,首当其冲的便是:注册资金。
收藏 0 赞 0 分享

购买虚拟主机10个注意事项

下面是我觉得在选购虚拟主机时候需要考虑的几点要素,希望对大家在选购虚拟主机的时候有一定的帮助。
收藏 0 赞 0 分享

搜索引擎流量下跌后的分析诊断过程

对于SEO来说,除了需要通过各种手段来实现网站的流量增长之外,我们也需要面对一个严峻的问题:流量下跌后,怎么办?这个时候,我们就需要分析流量下跌的原因,同时提出解决方案。这篇文章,我跟大家简单讨论下,如何做好搜索引擎流量下跌后的分析诊断过程。
收藏 0 赞 0 分享

新手认识 制作一个网站的成本分析

今天这个话题也是我很早就想谈的,谈谈自己从做个人网站到现在,在网站空间成本上的体会。看对大家有没有不一样的启发。
收藏 0 赞 0 分享

Groupon 美国团购网站的三方共赢的盈利模式

超低价,抢!以往这样的状况大多发生在商场的折扣专区,现在,这一场景在美国团购网站Groupon.com(下称Groupon)上得到再现,用户们疯抢网站每天推出的诸如餐饮、SPA、跳伞以及高尔夫这样的商品或服务机会。
收藏 0 赞 0 分享
查看更多