VMware单个虚拟机的故障监控和重置步骤

自从发布VI3 3.5以来,VMware HA开始实验性支持单个虚拟机故障的监控,并且基于你预先设置的方式进行故障处理,这个新的模块称为虚拟机故障监控模块。虚拟机故障监控可以处理来宾操作系统的故障。 
关于虚拟机故障监控模块
由于虚拟机故障监控是实验性支持,因此默认是关闭的。如果你启用了该功能,VMware HA将开始检测虚拟机是否可用。VMware HA通过VMware Tools收集到的心跳信息来决定虚拟机的可用性。
每一台虚拟机中的VMware Tools每秒钟发送一次心跳信息,虚拟机监控模块每20秒检测一下心跳。如果心跳在用户指定的时间内没有收到,虚拟机监控模块就认为该虚拟机发生故障,就会重置该虚拟机。
虚拟机故障监控模块可以自己分辨出来虚拟机是打开的,但是心跳中止;还是虚拟机关闭、迁移走了。它也可以区分是虚拟机太忙导致心跳丢失还是真的发生了虚拟机故障,因为虚拟机故障监控模块可以判断出在特定时间段心跳的次数为零。
当然,虚拟机故障监控模块工作的基础是该来宾操作系统里已经安装了VMware Tools,没有安装VMware Tools的虚拟机,该模块无法监控。
使用虚拟机故障监控模块
你可以为整个群集配置虚拟机监控模块,当然,该虚拟机群集必须先启用VMware HA,否则没法进行监控。当然,你没法创建一个支持虚拟机故障监控的群集,你要先创建一个普通群集,然后更改它的配置。
具体如何来配置虚拟机故障监控模块呢?下面是具体的步骤:
1. 登陆到VMware VI客户端,在Inventory栏,选择需要监控的群集,点击鼠标右键;
2. 选择Edit Settings;
3. 如果该群集没有启用VMware HA,在General选择Enable VMware HA;
4. 在接下来选择Advanced Options
5. 在出现的选项里输入合适的值,然后点击OK。
该页目前支持的选项解释如下:
如果你没有进行任何配置,说明das.vmFailoverEnabled仍然是false。如果虚拟机故障监控已经启用,这些选项你都没有进行配置的情况下,所有的选项都会使用默认配置。
配置实例
下面的实例是某个虚拟机故障监控的配置情况。
该配置说明:
1. 在Virtual Center Server上已经启用了虚拟机故障监控模块;
2. 如果60秒或更长时间内不能收到该群集的心跳,VMware HA将重置该虚拟机
3. 每台虚拟机允许240秒时间来启动稳定其心跳。该时间用来进行虚拟机启动和VMware Tools重置;
4. 如果一天中虚拟机故障达到或超过3次,VMware HA就不再进行虚拟机重置。
当然,目前虚拟机故障监控模块仍然处于试验性支持阶段,因此没提供明确的系统管理员通知。

小伟子  发表于: 2009-12-27

我要回答

电子邮件地址不会被公开。 必填项已用*标注

敬请读者进行回答,本站保留删除与本问题无关和不雅内容的权力。