虚拟化 给企业备份注入新思路

日期: 2008-03-27 来源:TechTarget中国

  虚拟化技术逐步深入应用,使得CIO们不得不开始重新考虑自己的存储备份系统。如何让虚拟化技术与企业中传统的文件备份系统更好地结合,如何更好地应用虚拟带库等,都已经成为了CIO们关注的问题。
 
  ■ 编译自《Computerworld》


  今天,虚拟化技术给企业存储带来了越来越深入的改变,将企业中各种传统的文件备份系统与虚拟化技术结合的一些新兴技术的出现,使得用户们开始重新考虑自己的文件备份方式。


  过去,绝大多数企业广泛应用的文件备份系统包括:用来做短期和即时数据备份的磁盘;用来长期存储备份数据的磁带库;还有比如IBM Tivoli和HP StorageWorks之类的备份软件。然而,在今天这个“虚拟化”的时代,仅仅有这些磁带库和软件产品已经不能满足企业用户的需求了。


  Forrester Research专注于虚拟化的高级分析师Stephanie Balaouras说:“在文件备份的虚拟化进程上,CIO们不应该再采取观望的态度了。特别是在越来越多的企业开始在关键业务系统中使用服务器虚拟化应用的今天,如果再不仔细考虑文件备份与虚拟化技术的结合并做出选择的话,备份很可能会成为企业在未来面临的重大难题和挑战。”


  三种方式


  改变备份策略


  事实上,传统的备份系统与服务器之间是一一对应的关系。虽然这些久经考验了的备份系统与软件可以支持存储区域网络(SAN)、光纤以及最新的操作系统和服务器软硬件的升级与更新,但是,它们已经不足以应对复杂的“虚拟化世界”,因为在虚拟化的环境中,同一台服务器上可以运行多个客户机操作系统。


  Gartner负责服务器与存储的高级分析师Dave Russell提出了三种可以普遍适用的虚拟化备份策略。其中最常见的方法是在每个虚拟机上分别安装代理软件,然后使用传统的企业备份软件来进行文件的存储备份。


  第二种方法是创建一个虚拟机镜像,并在异地主机上实现存储服务或者获取逻辑单元号(逻辑单元号是指用于SCSI总线的惟一识别号,它使得总线能区别其他八个设备,而它们中每个都是一个逻辑单元)的每日快照。


  第三种方法是使用整合备份系统软件将存档功能增加到虚拟机上,也就是说,只保存上一次备份以后更改过的部分。这样,企业就可以实现单一文件的恢复,即使这个文件是来自于30多个全部在一台物理服务器上运行的操作系统的某个系统。
  
  “在目前,大多数企业倾向于采用备份代理和传统的文件备份软件,因为这种方式是采用物理服务器实现的,比较简单易行。但是,这种方式也被证明是要付出较高成本,因为虚拟机的数量多、规模大,同时还需要许可证。”Russell说。


  我们注意到,在VMware或其他一些虚拟化产品中都包括了备份代理,它们以此来协助服务器管理人员将传统的文件备份流程整合到虚拟机上。这一方式的核心优势在于成本低,因为备份代理通常是免费的,或者仅仅需要很少的费用。


  但从另一个角度来看,备份代理使得服务器管理员们不得不使用一个相当简化的方式:将整个虚拟化服务器进行存档,但是却不能选择数据量或者客户操作系统。并且,服务器管理员还不能存储特定部分的数据或者对虚拟机进行实体化来校验数据的完整性。


  虚拟机快照技术


  Russell认为,企业创建虚拟机数据存储镜像的一个新趋势是采用虚拟机快照技术,因为这一技术提供了更多的灵活性,并且降低了成本,同时实现了企业备份在整个地区的实体化,从而与企业灾难备份策略相适应。


  比如,在位于旧金山的加利福尼亚大学临床研究中心的一个分部Immune Tolerance Network(ITN)中,虚拟化备份系统已经不仅仅是为了应付灾难备份而设计,其还能协助研究人员进行临床试验以战胜新的疾病。


  ITN将逻辑单元号存档或者存放在磁盘驱动器的特定地址,采用重复数据删除算法来去除冗余数据,这保证了虚拟服务器数百万兆字节的存档。研究中心的研究人员可以申请额外的逻辑单元号——而这是在物理服务器上很难或者根本不可能实现的。


  “传统的方法是将磁带放入一个文件备份系统中进行多服务器的备份,但是这种方法现在已经过时了。一旦用户开始使用虚拟存储器,并将存储与物理磁盘分离,就开始了一种新的备份方式。首先,就是提供了一个新生成的逻辑单元号,这时认定的存储量实际上超额了,研究人员认为他们拥有了2TB的数据存储量。”Michael Williams说。


  但是,事实上,逻辑单元号是按照需求配置的,也就是说,是基于快照技术的,在物理磁盘上分配刚好够用的存储空间,大概每个物理磁盘是20GB。这一存储量的数据每四个小时备份一次,相当于对系统发生硬件故障时的备份(因为数据进行完全存档,这样就可以完全恢复之前的状态)。


  Williams进一步解释说,之后这一存档系统——由Network Appliance的SnapShot和SnapMirror所创建的——被转移到了位于弗吉尼亚州Herndon的一个远程地点,使用Veritas NetBackup通过广域网在SATA驱动器上创建了一个全镜像备份,从而进一步地存档备份。


  Williams认为快照技术对研究中心的研究人员来说是很有益处的,因为数据恢复被简化了,同时速度也比采用非虚拟化技术时更快。研究人员可能会像从前一样要求进行数据恢复,然而现在不需要进入磁带库就可以进行数据恢复了。但是,其对于IT系统来说却增加了复杂度。


  的确,虚拟化技术支持的数据恢复流程对于IT系统来说是更加复杂了,因为IT员工可能不得不从一个分离的备份系统恢复点中找到并固定虚拟逻辑单元号。不过,无论怎样,终端用户用几个小时就可以得到所需要的数据,这比之前所需的时间少了很多。


  另一个优点就是引入了重复数据删除技术。重复数据删除技术是一个处理流程,采用备份软件可以识别多次出现的相同数据,同时删除冗余数据,仅将一份数据进行存档。比如,在ITN中,有150个虚拟服务器,大概有100台Windows系统的主机,NetApp软件可以给Windows系统制作一个8.5GB的可识别镜像的复本,同时给每个附加文件创建一个指纹文件用于识别——这样可以节省磁盘空间,因为其并没有对相同的Windows数据进行重复备份。


  持续的数据保护


  前面提到的第三种进行虚拟化备份的方式是采用了一种持续的数据保护系统,例如Vizioncore vRanger或者PHD的esXpress系统。


  卫生组织Health First的外伤中心就采用了连续数据保护系统,这一系统在与150TB的存储区域网络相连接的19个VMware ESX服务器上运行着300个客户机。其实,Health First采用了IBM Tivoli软件来进行传统备份,但是由于其大型的虚拟服务器架构,他们决定增加一个连续备份系统。


  Health First负责虚拟化的工程师Jeff Allison说:“我们所要求的灾难后的重建时间非常短。现在,我们使用Vizioncore vRanger在每天晚上给每台虚拟机进行热备份,文件备份流程开始于下午五点,在两台不同的机器上进行,一直进行到凌晨两点。这主要是对230台虚拟机上的数据进行备份,而剩下的70台虚拟机将在早上进行备份。但与此同时,运行的医疗软件不会受到热备份的影响。”


  另外,Allison还强调说,外伤中心和门诊部门对IT系统正常运行时间的要求更高,因为医疗器械的数据丢失很可能会对病人的生命造成威胁。


  Allison举了一个例子,一台测试/开发物理服务器的控制器坏了,这使得80台虚拟机服务器全部无法正常使用,只有进行漫长的数据恢复才能解决这个问题,而通常这需要好几个小时。如果有一个连续备份系统进行系统恢复则只需要一个小时,并且可能只需要一个技术人员就可以应付了,而不是很多人都为此而忙碌。
 
  印第安那大学是另一个数据连续备份的案例,这所大学的IT主管反对使用虚拟机镜像或者代理的方式进行备份,因为他们对灾难恢复时间要求也很高,当然,同时持续备份还能够进一步增加数据存档所带来的好处。


  Gartner的高级分析师Robert Reynolds说:“虚拟机被包含在了一个可通过快照进行完整存档的文件中,对于大部分的虚拟机来说,这个文件有足够的稳定性可以作为一个灾难恢复备份而进行复制。”不过,很明显,数据库服务器和其他流程在创建灾难备份时需要被额外地关注。


  “我们在每台VMware ESX服务器上运行每周的工作,采用PHD的esXpress虚拟化备份设备来为虚拟机创建灾难恢复备份,并且在ESX服务器的本地存储器上创建了一个复本。现在,我们正在进行第二阶段的开发:利用FTP将灾难恢复备份文件传送到另一台服务器上,服务器上的Tivoli Storage Manager软件将负责接收这个文件并发送到Indianapolis——距离Bloomington大约五十英里的地方。”Reynolds介绍说。


  前面我们介绍了几种应用虚拟化技术改变传统备份策略的技术和方法。事实上,在虚拟化目前的发展阶段,最好的选择就是混合采用以上这些技术——选择一个镜像水平的文件备份并连续地制订这些文件的索引,这样企业就可以进行单一文件的恢复,并快速地提取其快照;同时采用一个传统备份软件和虚拟代理来为服务器上的内容编制索引。不过,这样显然提高了管理的复杂度,并在传统备份方式上增加了一个提取层。但相信随着存储备份技术的发展,这些问题会很快解决,并不断地满足企业用户的需求。


  链接


  虚拟带库:虚拟化与备份的有效整合


  简单地说,虚拟带库是将磁盘空间虚拟为磁带空间,并能够在传统的备份软件上实现与传统磁带库同样的功能。


  传统磁带库的存储介质是磁带,磁带的优势是可以集中保存、数据的移动比较方便。但是,磁带介质不是非常稳定,容易受粉尘、湿度、磁粉、粘连、霉点等因素的影响,出现读写错误,另外对保存环境的要求也比较高。


  鉴于传统磁带的这些缺点,虚拟带库的概念早在10多年前就已经被主流存储厂商所提出。然而,由于技术和市场的原因,市场认知度一直不高。而在近些年,随着磁盘技术的快速发展,虚拟带库也越来越成为了备份市场的焦点。


  虚拟带库使用磁盘作为存储介质,使用软件在逻辑上将磁盘存储系统(包括SCSI、光纤阵列、SAN存储网络等)虚拟为传统的磁带库设备,自动地在逻辑上实现驱动器的功能,磁盘存储系统的RAID、镜像等功能也可以从底层保护备份的数据。


  虚拟带库的实现大致可以分为三种方式。第一,纯软件方式,即将磁带库模拟软件直接安装在备份服务器上,把备份服务器的文件系统分区模拟成磁带库,从而使备份软件以磁带库方式使用磁盘文件系统。这种方式磁盘本质上仍然在线,而且对备份主机的负担比较大,使用的环境有局限性,优点是成本比较低。


  第二种是专用服务器级虚拟磁带库,这种方法实际上是另外一种虚拟磁带库的软件实现方式,通过把虚拟磁带库管理软件安装在一台独立的专用服务器内,而将该服务器及所连接的磁盘存储设备模拟成磁带库。这种方法的特点是速度较快,且数据受主机的影响较小,不足是需要利用一台服务器作为虚拟磁带库管理器,系统优化性略低。


  第三,专用控制器级集成虚拟磁带库设备,也就是将磁带库模拟管理软件固化在特别设计的硬件设备中,并形成了专用的虚拟磁带库设备,这种设备需要配置一定数量和类型的主机接口和后端存储磁盘阵列接口。专用的虚拟磁带库设备硬件结构不同于服务器,设计采用了精简的硬件模块和精简的操作系统内核(一般为Linux内核),且充分考虑了与主机及存储设备的连接能力。


  如果用户需要的仅仅是将虚拟带库作为备份缓存,就是说先将数据备份到虚拟带库上,当备份服务器空闲的时候,再将虚拟带库的备份数据转移到物理的磁带库上,而且应用的负载不大,并在PC或者服务器可以同时承担备份服务器和虚拟带库两种功能的情况下,用户可以使用第一种成本比较低廉的方案。
  
  如果用户对第一种方案的备份性能不太满意,或者用户的负载稍微大一点,那么可以采用第二种的虚拟方式:将备份服务器和虚拟带库分开,使用一台单独的服务器作为虚拟带库。在这种方式下,数据直接以数据块的方式存放,顺序读写,性能较好。这种方式适合于数据量不大,有一定负载的备份情况。
 
  专用控制器设备的虚拟方式容量一般可以达到几十TB,适合整个数据中心的备份。建议2TB容量以上的数据备份选用这种虚拟方式,虽然增加了一些成本,但是由于有高阶的光纤磁盘阵列作为后端存储,效能和可靠性都很高,而且扩展能力很强,也能实现集中存储。
 

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐