如何处理ESXi主机的黄色告警

日期: 2012-09-03 作者:张冀川 来源:TechTarget中国

当我们登录到vCenter Server对虚拟化环境进行管理时,有时会在ESXi主机图标的右下方发现黄色的告警。通过检查可以发现ESXi主机的运行状况是正常的,黄色告警实际上只是为了引起管理人员的注意。本文对引起黄色告警的两种情况(ESXi主机启用SSH以及VMware HA集群没有配置管理网络冗余)进行解读并提供相应的调整建议。   ESXi主机启用SSH   为了能够通过SSH客户端访问ESXi主机,我们需要登录到ESXi主机的管理控制台开启主机的ESXi Shell。

如下图1所示,当开启ESXi Shell后,就会在ESXi主机图标的右下方发现黄色的告警,在ESXi主机的摘要选项下可以看……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

当我们登录到vCenter Server对虚拟化环境进行管理时,有时会在ESXi主机图标的右下方发现黄色的告警。通过检查可以发现ESXi主机的运行状况是正常的,黄色告警实际上只是为了引起管理人员的注意。本文对引起黄色告警的两种情况(ESXi主机启用SSH以及VMware HA集群没有配置管理网络冗余)进行解读并提供相应的调整建议。

  ESXi主机启用SSH

  为了能够通过SSH客户端访问ESXi主机,我们需要登录到ESXi主机的管理控制台开启主机的ESXi Shell。如下图1所示,当开启ESXi Shell后,就会在ESXi主机图标的右下方发现黄色的告警,在ESXi主机的摘要选项下可以看到这一提示信息。

图1. ESXi 主机SSH启用告警 
图1. ESXi 主机SSH启用告警

  为了保证ESXi主机的正常运行,ESXi Shell默认是关闭的,在生产环境中也不建议启用SSH。此时消除告警的方法就是登录到ESXi 控制台中,选中下图中的“Disable ESXi Shell”,然后单击回车键ESXi Shell就将关闭。
 

图2. 在ESXi主机控制台下禁用ESXi Shell
图2. 在ESXi主机控制台下禁用ESXi Shell

  但是为了对ESXi主机进行故障诊断,有时需要暂时启用SSH。在启用SSH的情况下是否能够消除ESXi主机图标的右下方的黄色告警呢?实际上在不关闭主机SSH的情况下,消除告警只需要进行如下两个操作:
 
  (1)进入配置选项卡,选择软件的高级设置选项

图3. ESXi主机配置选项卡
 
图3. ESXi主机配置选项卡

  (2)在弹出的“高级设置”对话框中选中“UserVars”,在右侧的配置参数中,选择UserVars.SuppressShellWarning,将文本框中的值从0改为1,然后单击确定即可。这样就忽略了对ESXi Shell的告警。


图4.禁用ESXi Shell告警信息 
图4.禁用ESXi Shell告警信息

  ESXi主机没有冗余的管理网络

  除了开启主机的ESXi Shell会导致出现黄色的告警之外,如果ESXi主机没有配置冗余的管理网络同样会出现类似的告警信息。

  如下图5所示,以ESXi 4.1主机构成的HA集群为例,可以在摘要选项卡下看到由于主机没有配置冗余的管理网络导致出现黄色告警。由于HA集群中的所有ESXi主机需要借助管理网络传递心跳信息,所以VMware建议配置冗余的管理网络,否则就会在集群中没有配置冗余管理网络的ESXi主机图标的右下方显示告警信息。


图5. ESXi主机没有冗余的管理网络导致告警 
图5. ESXi主机没有冗余的管理网络导致告警

  选择ESXi主机的配置选项卡,通过硬件部分的网络选项可以发现这台ESXi 4.1主机管理网络所在的虚拟交换机是vSwitch0,配置了两块网络适配器,但是其中的vmnic1的连接状态是断开的。因此该ESXi主机提示了管理网络没有冗余的告警。
 

检查ESXi 主机的管理网络
图6. 检查ESXi 主机的管理网络

  通过检查vmnic1的物理连接状态,发现其对端连接的物理交换机端口松动,导致连接中断。连接恢复正常后,管理网络所在的虚拟交换机vSwitch0连接的物理适配器就有两个了,此时告警就消除了。

  如果ESXi主机的网卡数量有限,同时又要实现管理网络和虚拟机网络的分离,那么可能无法为管理网络分配冗余的适配器。在这种情况下是否有办法消除黄色告警呢?为了消除这个告警需要按照以下步骤操作:

  (1)选中 HA 集群,在弹出的右键菜单中选择“编辑设置”;

  (2)在弹出的集群设置会话框中,选择“VMware HA”选项,然后选择右侧的“高级选项”按钮;

图7. 配置HA 集群 
图7. 配置HA 集群

  (3)在弹出的高级选项对话框中,在选项中输“das.ignoreRedundantNetWarning”,在选项值中输入“true”,然后单击确定即可;

图8. 忽略HA集群的无管理网络冗余告警
 
图8. 忽略HA集群的无管理网络冗余告警

  (4)为了使配置生效,需要先关闭集群的HA功能,然后再启用。如下图所示,选择集群功能选项,在右侧的功能选项中将“打开VMware HA”前面的复选框取消掉并单击“确定”按钮即可关闭或开启集群的HA功能。
 

图9. 关闭并开启集群的HA功能
图9. 关闭并开启集群的HA功能

  请注意,在vSphere 4.1环境下,由于HA集群借助管理网络传递心跳信息,所以建议为HA集群中的所有主机配置冗余的管理网络。

  为了解决由于管理网络发生故障导致HA集群无法传递心跳信息以及其他问题,VMware在vSphere 5.0中重新设计了HA架构,在HA集群中的每台ESXi主机运行一个特别的、独立于vpxd代理(用于和vCenter Server进行通信)的故障域管理器(Fault Domain Manager),FDMs默认仍然通过主机管理网络进行通信,当管理网络不可用时集群中的ESXi主机能够通过Datastore进行通信。

  作为管理人员,在对虚拟化环境进行日常的维护过程中,需要留意各类告警信息以及相应的告警提示。通过对告警信息进行分析,能够预先发现虚拟化环境可能存在的问题。虽然本文提供了通过参数配置简单地忽略各类告警信息的方法,但是还是建议优先采用消除告警的方法,只有消除了不利因素,才能保证虚拟化环境更加稳定的运行。

作者

张冀川
张冀川

TechTarget中国特约专家,任职于某国企信息中心,负责数据中心硬件基础设施及信息系统运维管理工作,对虚拟化及云计算技术有浓厚兴趣,并在工作中积极应用

相关推荐