MapReduce服务 MRS-Host健康检查指标项说明:OMS的HA状态
OMS 的HA状态
指标项名称:OMS的HA状态
指标项含义:检查OMS的双机资源是否正常。OMS双机资源状态的详细信息可使用${CONTROLLER_HOME}/sbin/status-oms.sh查看。如果有模块状态异常,认为不健康。
恢复指导:
- 登录主管理节点,执行su - omm切换到omm用户,然后执行${CONTROLLER_HOME}/sbin/status-oms.sh查看OMS状态。
- 如果floatip、okerberos、oldap等异常,可参见告警ALM-12002、ALM-12004、ALM-12005分别进行处理。
- 如果是其他资源异常,建议查看相关异常模块的日志。
controller资源异常:查看异常节点的/var/log/Bigdata/controller/controller.log。
cep资源异常:查看异常节点的/var/log/Bigdata/omm/oms/cep/cep.log。
aos资源异常:查看异常节点的/var/log/Bigdata/controller/aos/aos.log。
feed_watchdog资源异常:查看异常节点的/var/log/Bigdata/watchdog/watchdog.log。
httpd资源异常:查看异常节点的/var/log/Bigdata/httpd/error_log。
fms资源异常:查看异常节点的/var/log/Bigdata/omm/oms/fms/fms.log。
pms资源异常:查看异常节点的/var/log/Bigdata/omm/oms/pms/pms.log。
iam资源异常:查看异常节点的/var/log/Bigdata/omm/oms/iam/iam.log。
gaussDB资源异常:查看异常节点的/var/log/Bigdata/omm/oms/db/omm_gaussdba.log。
ntp资源异常:查看异常节点的/var/log/Bigdata/omm/oms/ha/scriptlog/ha_ntp.log。
tomcat资源异常:查看异常节点的/var/log/Bigdata/tomcat/catalina.log。
- 如果通过日志无法排除问题,请联系运维人员处理,并发送已收集的故障日志信息。