网站开发中的文件存储目录结构的探讨

所属分类: 网络编程 / 相关技巧 阅读数: 764
收藏 0 赞 0 分享
对于少量用户写信息,大量用户都是在看信息的网站:例如CMS系统,编辑发咨询,用户看,例如中小企业产品发布网站。 对于这类需求我们可以把文件专门放到一个目录下,例如放到网站根目录的upload目录下,然后按天建文件夹,将每天的文件放到一个目录下,文件名可采用数字生成。例如:upload/20100612/1224455.jpg;通常的情况下这种目录结构就可以保证每个目录下不会有太多的文件。

对于博客,论坛应用,需要对每个用户分配文件存储空间,如果有需求的话还要限制用户的存储空间,对于一般规模的网站目录结构可以用用户id+日期的形式;例如upload/234/20100612/abc.jpg。如果规模较大,可以将文件分布到几台不同的服务器上,可以根据用户id制定一个分布的规则,每台服务器用不同的域名,并在数据库中存储文件的完整url地址,这种情况下的路径结构通常是:http://file1.abc.com/upload/234/20100612/abc.jpg。

我曾经观察过微软的文件下载文件存储的路径结构,他是用guid生成的一个路径,例如:http://download.microsoft.com/download/5/6/7/567758a3-759e-473e-bf8f-52154438565a/dotnetfx.exe ;它这个结构目录是guid的前三位和guid做了一个4级的目录,这种情况下,就保证了,每个目录下不会有很多目录,因为是guid所以每一个文件都放到一个单一的目录下了,这种结构对于做下载的网站应该是一种不错的选择。

还有web2.0的网站会涉及到用户头像的存储,头像的存储比较特殊,一个用户固定有那么几个尺寸的图片,我们分析一下开心网和sina的头像地址,看他们是如何做的存储
1. 开心网的存储,如下是两对链接地址,每对中的第一个是头像地址,第二个是用户首页,首页中的参数是用户id

http://pic1.kaixin001.com.cn/logo/13/39/50_133973_82.jpg

http://www.kaixin001.com/home/?uid=133973

http://www.kaixin001.com/home/?uid=36131662

http://pic.kaixin001.com.cn/logo/13/16/50_36131662_2.jpg

可以看出开心网的存储方式是存储到几台不同的服务器上,头像的地址是根据用户的id去划分目录做的存储,id的前4位被分成两个目录,文件名用的是包含前缀+用户id+后缀的方式做的存储。
2. 如下是两对sina的空间地址,和博客头像的地址

http://space.sina.com.cn/u/1642511512

http://portrait1.sinaimg.cn/1642511512/blog/180

http://space.sina.com.cn/u/1725778305

http://portrait2.sinaimg.cn/1725778305/blog/180

Sina博客头像的存储方式和开心不同,是用户id做一级目录,然后加上blog(应该是应用的名字)再加上一个数字180(猜想可能是头像类型的数字);sina和开心的区别是没有图片扩展名,猜想它可能是把头像放到了一个键值对的数据库中,根据url参数从键值对数据库中取出头像的图片数据,然后输出给客户端

从上面的分析可以猜想开心可能是直接存的文件,而sina可能存储在键值对数据库中,如果数据量很大的话,应该是新浪的方式根据伸缩性。

最后我们还得提一下为我们提供服务的博客园的存储方式,如下地址:

http://pic.cnblogs.com/face/u15230.jpg

http://pic.cnblogs.com/face/u105416.png

http://pic.cnblogs.com/face/u40200.png

很简单直观应该是放到了一个目录下,直接用户id做的文件名,没有分目录结构,这样在文件夹中文件过多时是否会引起性能问题呢?
更多精彩内容其他人还在看

firefox 扩展开发技巧

firefox 扩展开发
收藏 0 赞 0 分享

php asp.net 比较 [推荐]

如今当提到 Web 开发时,您有许多选择。这些方法中许多都涉及到预处理 - 即,利用特定的标记将代码嵌入到 HTML 页面中
收藏 0 赞 0 分享

UTF-8 BOM 可能导致样式错乱的解决方法

utf-8 是一种在web应用中经常使用的一种 unicode 字符的编码方式,使用 utf-8 的好处在于它是一种变长的编码方式,对于 ANSII 码编码长度为1个字节,这样的话在传输大量 ASCII 字符集的网页时,可以大量节约网络带宽。
收藏 0 赞 0 分享

Web 开发常用工具 大家自己查找下载

看到了Web通信分析工具 这篇文章,除了burpsuite其他我日常都经常使用。于似乎我整理了一下我自己用的其他的WEB开发工具。
收藏 0 赞 0 分享

遇到不能复制的网站怎么办?

有时我们看到喜欢的网页内容时定会产生复制下来为我所用的冲动,不过当你点击鼠标时它却没有任何反应,选择的内容没有任何变化,不禁有点扫兴。不要紧,办法总比困难多!
收藏 0 赞 0 分享

URL 长度有限制吗?

众所周知, 传递小量参数(在没有其他原因,例如隐藏参数值的情况下)推荐使用GET方法,传递大量参数推荐使用POST方法。原因是什么呢?
收藏 0 赞 0 分享

声音验证码制作方法

收听验证码已经比较普遍了,使用户看不清楚的情况下可以通过耳朵来收听验证码,但网上搜了很久没看到有具体的制作方法,自己想了想,还是按自己的方法来实现了,呵呵。
收藏 0 赞 0 分享

防范SQL注入式攻击

SQL注入式攻击是利用是指利用设计上的漏洞,在目标服务器上运行Sql命令以及进行其他方式的攻击动态生成Sql命令时没有对用户输入的数据进行验证是Sql注入攻击得逞的主要原因。
收藏 0 赞 0 分享

Web 设计与开发者必须知道的 15 个站点

今天读到一篇文章,介绍了15个对 Web 设计与开发师极端有用的站点,里面有不少也是我们一直在使用的,也许对很多人都有用,翻译出来以饷同仁。
收藏 0 赞 0 分享

十分钟内学会 避免用户刷新导致重复POST提交

在Web应用中,采用POST提交信息是非常常见的,然而如果目标页面打开得太慢,用户就可能会刷新页面,这时候之前已经提交过的信息就会被重复提交。
收藏 0 赞 0 分享
查看更多