为硬件故障制定恢复计划——制定文档

日期: 2014-08-12 作者:Brian Kirsch翻译:王学强 来源:TechTarget中国 英文

我在第一部分《为硬件故障制定恢复计划——设计》中介绍了设计恢复计划时的注意事项,比如考虑针对可用性还是故障进行设计等。这里继续介绍另外一个重点——制定文档。 为可能的故障制定文档 你的虚拟环境中另外一个非常重要的部分是经常拖延或者忽略相关文档。现在的环境中,一切都在快速变化,以至于文档已经成为项目中最后完成的部分,在许多情况中,甚至从不制定文档。

如果你想要收回了一些对虚拟环境中管理工具的访问权限,是否知道IP地址和主机名是什么?存储LUN和网络vLAN映射呢?当我们安装或者扩展环境时,我们经常对比和参考一些已经存在的配置,而不是参考文档——在许多情况下,是因为我们没有足够的时间来创建文档。 比……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

我在第一部分《为硬件故障制定恢复计划——设计》中介绍了设计恢复计划时的注意事项,比如考虑针对可用性还是故障进行设计等。这里继续介绍另外一个重点——制定文档。

为可能的故障制定文档

你的虚拟环境中另外一个非常重要的部分是经常拖延或者忽略相关文档。现在的环境中,一切都在快速变化,以至于文档已经成为项目中最后完成的部分,在许多情况中,甚至从不制定文档。如果你想要收回了一些对虚拟环境中管理工具的访问权限,是否知道IP地址和主机名是什么?存储LUN和网络vLAN映射呢?当我们安装或者扩展环境时,我们经常对比和参考一些已经存在的配置,而不是参考文档——在许多情况下,是因为我们没有足够的时间来创建文档。

比如当一个新来的VMware管理员需要为将要进行的维护禁用分布式资源调度(DRS)功能时,他会在在核心产品集群上将其关闭,而不是将DRS设为维护模式。禁用DRS可以保留所有的DRS关联规则和资源池配置,但是关闭DRS将会删除所有的规则和资源池。当然,当你选择关闭关闭时DRS系统会让你进行确认,但是很少有管理员会花费时间来查看每个对话框。不幸的是,这种情况也会发生在经验丰富的管理员身上,因为通常他们选择速度很快。如果删除了所有资源池和DRS规则,可能将生产集群置于不可控的健康状态。当然,可以从内存中重新创建一些规则,但是如果没有合适的文档,你就需要从头开始,而完成这一切的可能性微乎其微。拥有恰当的文档可以将这种需要很多天努力、并且影响虚拟机性能的情况转变为一个可以轻松改正的错误。

在这种情况中,技术和设计并没有问题。故障是由因为人为误操作引起的,但是文档的缺失使得这种情况更加糟糕。尽管管理层和系统管理员都同意文档十分重要,但是通常快速完成工作的节奏和时间的缺乏还是让我们不再创建文档。幸运的是,像Neverfail IT Continuity Architect这样的产品可以帮助IT部门解决一些问题。这些产品可以连接你的虚拟基础设施,映射出现有的环境,甚至是服务器和应用程序之间的依赖性。其为你的基础设施创建文档映射,在不需要花费管理员几个小时工作的情况下让你深入了解自己的虚拟环境。

增加专用管理网络集群和恰当的文档,就可以解决虚拟环境中的硬件故障问题。我们需要承认在虚拟环境中出现故障的几率很小,可用性仍旧是我们的设计基础。但是如果我们采用这种方式,业务部门就可以针对那些几率很小、但是仍然可能发生的事故做出充分的准备。

翻译

王学强
王学强

TechTarget特邀编辑,毕业于计算机专业,现任职于外企IT分析师,负责网络、防火墙和服务器等系统运维工作,对虚拟化、网络安全和渗透测试拥有浓厚兴趣,工作外热爱旅行、汽车和健身。