网站运维 网站可用性说明

所属分类: 网站运营 / 建站经验 阅读数: 69
收藏 0 赞 0 分享
运维的工作包括(但不限于) 软硬件部署、网络管理、应用程序维护、安全、容量规划、故障修复等等。

运维,有别于"运营"。在中文的语境中,运营更多和业务结合在一起的。而运维,则是偏向技术层面。

任何一个成功的站点都离不开一只优秀的运维团队,尽管他们更多时候隐身在网站背后不为人知。

网站可用性

所谓网站可用性(availability)也即网站正常运行时间的百分比,这是每个运营团队最主要的 KPI (Key Performance Indicators ,关键业绩指标)。对于 Web 站点来说,传统的那个 24x7 的说法已经不是很适用了,现在业界更倾向用 N 个9 来量化可用性, 最常说的就是类似 "4个9(也就是99.99%)" 的可用性。看一下表 1 能更为直观一些。

描述 通俗叫法 可用性级别 年度停机时间
基本可用性 2个9 99% 87.6小时
较高可用性 3个9 99.9% 8.8小时
具有故障自动恢复能力的可用性 4个9 99.99% 53分钟
极高可用性 5个9 99.999% 5分钟

根据墨菲定理的推论,世界上没有 100% 可靠的 Web站点(除非不运行)。业界网站的可用性都是多少?引人注目的 Web 新贵 Twitter (http://twitter.com), 2008 年前四个月的可用性只有 98.72%,有 37小时 16分钟不能提供服务,连2个9 都达不到,甚至还没达到"基本可用"状态。电子商务巨头 eBay 2007 年的可用性是 99.94%,考虑到 eBay 站点的规模与应用的复杂程度,这是个很不错可用性指标了。Web 应用类型决定了不同的站点对可用性的依赖性是不同的。 要知道 4 个 9 的可用性实际上是很难实现的目标。至于 5 个9 的 Web 站点,一半靠内功,另一半恐怕是要靠点运气。

wikimedia_db2.png
(图1 维基百科网站的一台数据库服务器的可用情况报告, 由Nagios的监控得到的)

多数情况下,网站可用性会是 SLA (Service Level Agreement, 服务水平协议) 中的一个重要度量指标,也是运维团队向自己的客户(更多是公司老板)的正式承诺。可用性是能够持续改进的东西,KPI 制定者切不可狮子大开口,企图一步登天,拍拍脑袋提一些不太切实的指标。运维团队对可用性的承诺也不能开些空头支票,到头来两头难看。值得强调的是,如果是做第三方托管,更需要明确 SLA,明了第三方的服务能力,否则,费尽了九牛二虎之力终于保证了软硬件网络等环节都没问题了,IDC 却频繁断电或者IDC 出口网络不可用,这也绝对做不到预期的高可用性。

提高可用性的一些常规策略有消除单点,部署冗余设备(或集群),配置带外管理网络等,对可用性要求不高的网站这些可能足够了。如果要提供更高的可用性,比如 4 个 9 甚至 5 个9,就不是简单靠硬件就能做到的事情,还需要建立完善的流程制度、建立变更机制、提升事故响应速度等。正所谓是"没有最高可用,只有更高可用性"。

一般来说,所有的网站运维人员都在追求网站的更高级别的高可用性,但是必须注意,这是以额外的软硬件投入、更多的人力成本为代价的。成本与可用性之间也请做到良好的平衡,盲目追求高可用性是不可取的。

(补充:Twitter 的可用性现在已经有了很大提升,但是可以看到,可用性不佳并非一个网站的杀手,只要产品对用户足够友好,足够有粘度,足够不可或缺,那么可用性并非是第一要追求的运维目标。有些运维人员被 Amazon 的某年圣诞节期间宕机所造成的影响埋下心理阴影,其实没那么可怕,如果真的觉得可怕,那么你可能被一些厂商销售人员洗脑了。)

原文连接:网址: http://www.dbanotes.net/web/web_operations_availability.html

更多精彩内容其他人还在看

了解知乎网站的架构演进史

这篇文章主要介绍了了解知乎网站的架构演进史,知乎使用Python的异步框架Tornado的经验事例非常经典,值得Python学习以及爱好者们借鉴,需要的朋友可以参考下
收藏 0 赞 0 分享

企业网站要做成什么样子?是营销型网站还是官网展示

营销型网站建设是对网站的发展,整合了各种网络营销理念和网站运营管理方法,不仅注重网站建设的专业性,更加注重网站运营管理的整个过程,那么企业网站要做成什么样子?是营销型网站还是官网展?下面我们来看看吧
收藏 0 赞 0 分享

WEB标准之内容结构表现和行为到底怎么分离

从标准到国人重视那天起,就已经讨论了,但是停留在div+css xhtml+css 纯代码的分离,思想上流程上,到底如何分离
收藏 0 赞 0 分享

从网站设计到网站运营:网站建设中的六宗罪.

许多的网站越做越差,这是什么原因呢?今天小编就为大家带来一个网站从从网站设计到网站运营:网站建设中的六宗罪. 朋友们可以一起看看
收藏 0 赞 0 分享

云端架构助力魅族应用商店运维的案例分享

这篇文章主要介绍了云端架构助力魅族应用商店运维的案例分享,包括自研的Kiev框架通讯与分布式存储的使用等,非常具有借鉴意义,需要的朋友可以参考下
收藏 0 赞 0 分享

实例解析:如何做好企业网站的内容更新?

如何做好企业网站的内容更新?很多朋友都不是很清楚下面以轮滑网站为例探讨企业网站内容更新怎样做才更有档次,有需要的朋友可以过来参考一下,来看看吧
收藏 0 赞 0 分享

新手必看——电影贴吧引流都有哪些技巧

今天,我给大家讲讲电影贴吧引流都有哪些技巧,这个很适合新手,对贴吧引流都有哪些技巧感兴趣的朋友参考下
收藏 0 赞 0 分享

京东商城的云计算优先的技术战略简要总结

这篇文章主要介绍了京东的云计算优先的技术战略的简要总结,京东在Spark集群方面所投入的开发研究令人印象深刻,需要的朋友可以参考下
收藏 0 赞 0 分享

解析京东的大数据在运营中的实际应用

这篇文章主要介绍了京东的大数据在运营中的实际应用的案例,包括用户分析和企业管理决策等多方面的运用解析,需要的朋友可以参考下
收藏 0 赞 0 分享

探究京东咚咚架构演进

本文带领大家探究京东咚咚架构演进史, 自从京东开始为第三方卖家提供入驻平台服务后,咚咚也就随之诞生了,今天就和大家一起走进咚咚
收藏 0 赞 0 分享
查看更多