如何在虚拟环境里达到高可用性?(上)

日期: 2009-01-12 作者:Bill Weinberg翻译:唐琼瑶 来源:TechTarget中国 英文

网络基础架构设备需要通过建设高可用性(HA)架构,并且部署一个混合的商业成品(COTS)硬件以及商业和开源的软件组件达到更高的可靠性。曾经高度依赖自定义和私有平台的位于网络核心和边缘的系统如今建立在基于标准运输等级的操作系统、服务可用性论坛API和AdvancedTCA之上,并能达到第五或第六级别的高可用性。   通过虚拟化结合关键HA技术和实践,数据中心也能在现有的主流数据中心硬件和软件平台上实现更高可用性的益处。在本文中,TechTarget中国的特约作者Bill Weinberg将解释HA的组件以及如何使用高可用性方法增加数据中心可用性。

  高可用性定义及测量   可用性一般表示为在给……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

网络基础架构设备需要通过建设高可用性(HA)架构,并且部署一个混合的商业成品(COTS)硬件以及商业和开源的软件组件达到更高的可靠性。曾经高度依赖自定义和私有平台的位于网络核心和边缘的系统如今建立在基于标准运输等级的操作系统、服务可用性论坛API和AdvancedTCA之上,并能达到第五或第六级别的高可用性。

  通过虚拟化结合关键HA技术和实践,数据中心也能在现有的主流数据中心硬件和软件平台上实现更高可用性的益处。在本文中,TechTarget中国的特约作者Bill Weinberg将解释HA的组件以及如何使用高可用性方法增加数据中心可用性。

  高可用性定义及测量

  可用性一般表示为在给定时间内(一般是一年),可用系统运行时间与总体时间的比率。所以,如果你的架构允许在一年365天里宕机一天的话,那么你需要的可用性是364/365或者99.73%。

  提供高等级可用性的系统根据其所支持的NINE数量提升自己。高的可用性系统能达到第四、五或六级。

高可用性

  在现实中,宕机是由统计平均故障时间(MTTF)得到的值表示的。和宕机一样重要的是修复故障——平均修复时间(MTTR)所需要的时间。

  那么可用性应该这样计算:可用性=MTTF / (MTTF + MTTR)

  如果一个系统或组件提供50000小时MTTF,并且平均需要15分钟修复替换(例如查找和换出磁盘或刀片),那么这个系统的可用性是99.9995%,或者说达到了第五等级。

  从这个公式可以看出,通过使用更可靠的硬件和软件组件,即增加MTTF,并且通过降低故障持续时间和影响,即减少MTTR,这样的架构能增强整体可用性。

  HA:不是一刀切

  非专业人员倾向于考虑将IT设备故障持续几小时或几天,正好相反,网络数据架构系统优化后允许经常的短期断电,通常是不到一秒一次,并且迅速恢复并正常运行。

  在数据通信和电信行业,HA性能建立在一个专门混合的和COTS硬件和软件上。如今这种混合架构包括高级的TCA刀片、冗余以太网、RAID、Carrier Grade Linux(电信级Linux,即CGL)、日志文件系统和HA中间件。数据中心和其他企业IT场所也能使用更多通用的硬件和软件提升可用性。

  通过部署以下和其他技术有助于提供更高的可用性:

  • 消除CPU、存储、界面及程序等的单点故障
  • 加速故障检测、隔离与解决

  HA系统架构首先通过冗余达到第一个设计目的,尤其是通过配置空闲的硬件和软件处于不同的准备状态:

  • 热备份:所运行的硬件或软件的额外实例,处于接近或精确追踪实际使用资源的状态。一台热备份刀片服务器将反射或检测事务和其活动副本的状态数据,最小化故障转移的时间和破坏。
  • 暖备份(Warm spares):硬件或软件的可用实例,处于开启或初始化状态,不会紧密地追踪活动资源的状态。在故障转移时,暖备份必须在运行的事务或会话之前重新构建活动状态信息或重启。
  • 冷备份:与硬件或软件类似的程序镜像代替出现故障的活动实例,不过首先必须启动、下载或者在故障发生之前初始化和重新构建所有状态信息。

  一般来说,备份越及时(即越“热”),解决方案就越贵。

  第二个设计目的——加速故障检测、隔离及解决能建立在现有的故障检测机制上,像设备驱动暂停和协议重试。下面的技术通过流线化故障转移、定期地支撑所运行应用的状态、备份和同步化运行硬件和软件的状态信息提升可用性:

  • 健康监控:通过软件应用编程接口与硬件接口监控程序、界面、驱动和硬件本身的状态
  • 频率:健康的应用或节点周期性地使用频率监控软件检测。
  • 高或低标记:当可用内存、缓冲区、带宽等这样的资源达到临界点和正常状态时,设置和恢复警告条件
  • 监视器:即系统范围的计时器,重新启动或重新设置应用以及整个已超时的操作系统。健康的节点随着自身的运行周期性地重新设置计时器。冻结的系统会让监视器超时。
  • 检查指示:检查应用和操作系统本身或者通过外部守护进程周期性地写入日志或备份关键数据架构、整个数据段或内存镜像。检查过的数据可以离线保存或者用于动态地更新暖或热备份。

  高可用性与虚拟化之间的关系是什么?虚拟化作为HA平台需要用到哪些技术?得到了哪些附加好处?在本文的下半部分中,我们将一一为您解答。