MAPREDUCE服务 MRS-OMS健康检查指标项说明:Manager组件状态检查

时间:2024-04-22 14:37:52

Manager组件状态检查

指标项名称:Manager组件状态检查

指标项含义:Manager组件状态检查包括组件资源运行状态和资源HA状态。资源运行状态,取值为Normal、Abnormal等;资源HA状态,取值为Normal、Exception等。Manager组件包含acs、aos、cep、controller、feed_watchdog、floatip、fms、gaussDB、heartBeatCheck、httpd、iam、ntp、okerberos、oldap、pms、tomcat等。当运行状态和HA状态不是Normal时,认为指标不健康。

表2 Manager组件状态说明表

名称

说明

资源运行状态

Normal表示正常运行

Abnormal表示运行异常

Stopped表示停止

Unknown表示状态未知

Starting表示正在启动

Stopping表示正在停止

Active_normal表示主正常运行

Standby_normal表示备正常运行

Raising_active表示正在升主

Lowing_standby表示正在降备

No_action表示没有该动作

Repairing表示正在修复

NULL表示未知

资源HA状态

Normal表示正常

Exception表示故障

Non_steady表示非稳态

Unknown表示未知

NULL表示未知

恢复指导:

  1. 登录主管理节点,执行su - omm切换到omm用户。执行${CONTROLLER_HOME}/sbin/status-oms.sh查看 OMS 状态。
  2. 如果floatip、okerberos、oldap等异常,可参见告警ALM-12002、ALM-12004、ALM-12005分别进行处理。
  3. 如果是其他资源异常,建议查看相关异常模块的日志。

    controller资源异常:查看异常节点的/var/log/Bigdata/controller/controller.log。

    cep资源异常:查看异常节点的/var/log/Bigdata/omm/oms/cep/cep.log。

    aos资源异常:查看异常节点的/var/log/Bigdata/controller/aos/aos.log。

    feed_watchdog资源异常:查看异常节点的/var/log/Bigdata/watchdog/watchdog.log。

    httpd资源异常:查看异常节点的/var/log/Bigdata/httpd/error_log。

    fms资源异常:查看异常节点的/var/log/Bigdata/omm/oms/fms/fms.log。

    pms资源异常:查看异常节点的/var/log/Bigdata/omm/oms/pms/pms.log。

    iam资源异常:查看异常节点的/var/log/Bigdata/omm/oms/iam/iam.log。

    gaussDB资源异常:查看异常节点的/var/log/Bigdata/omm/oms/db/omm_gaussdba.log。

    ntp资源异常:查看异常节点的/var/log/Bigdata/omm/oms/ha/scriptlog/ha_ntp.log。

    tomcat资源异常:查看异常节点的/var/log/Bigdata/tomcat/catalina.log。

  4. 如果通过日志无法排除问题,请联系公有云运维人员处理,并发送已收集的故障日志信息。
support.huaweicloud.com/usermanual-mrs/mrs_01_0294.html