MAPREDUCE服务 MRS-查看MRS集群告警:通过管理控制台查看与清除告警

时间:2024-08-18 05:11:16

通过管理控制台查看与清除告警

  1. 登录 MRS 管理控制台。
  2. 选择“现有集群”,选中一个运行中的集群并单击集群名称,进入集群信息页面。
  3. 单击“告警管理”,在告警列表查看告警信息。

    • 告警列表每页默认显示最近的十条告警。
    • 支持在告警“级别”筛选相同级别的全部告警。结果包含已清除和未清除的告警。
    • 单击“全部导出”,在弹框内选择“保存类型”,单击“确定”可导出告警。
    表1 告警信息说明

    参数

    参数说明

    告警ID

    告警的ID。

    告警名

    告警的名称。

    级别

    告警级别。

    MRS 3.x之前版本集群告警级别为:

    • 致命

      指集群服务不可用,节点故障、 GaussDB 主备数据不同步、LdapServer数据同步异常等影响集群正常运行的告警,需要根据告警及时检查集群情况并恢复。

    • 严重

      指集群部分功能不可用的告警,包括进程故障、周期备份任务失败、关键文件权限异常等,需要根据告警及时检查报告告警的对象并恢复。

    • 一般

      指不影响当前集群主要功能的告警,包括证书文件即将过期、审计日志转储失败、License文件即将过期等告警。

    • 提示

      指级别最低的一种告警,起到信息展示或信息提示的作用,标识这件事情的发生,一般包括:停止服务、删除服务、停止实例、删除实例、删除节点、重启服务、重启实例、Manager主备倒换、缩容主机、实例恢复、实例故障、作业执行成功、作业执行失败等。

    MRS 3.x及之后版本集群告警级别为:

    • 紧急

      指集群服务不可用,节点故障、GaussDB主备数据不同步、LdapServer数据同步异常等影响集群正常运行的告警,需要根据告警及时检查集群情况并恢复。

    • 重要

      指集群部分功能不可用的告警,包括进程故障、周期备份任务失败、关键文件权限异常等,需要根据告警及时检查报告告警的对象并恢复。

    • 次要

      指不影响当前集群主要功能的告警,包括证书文件即将过期、审计日志转储失败、License文件即将过期等告警。

    • 提示

      指级别最低的一种告警,起到信息展示或信息提示的作用,标识这件事情的发生,一般包括:停止服务、删除服务、停止实例、删除实例、删除节点、重启服务、重启实例、Manager主备倒换、缩容主机、实例恢复、实例故障、作业执行成功、作业执行失败等。

    生成时间

    产生告警的时间。

    定位信息

    告警的详细信息。

    操作

    当告警可手动清除时,单击“清除告警”进行处理。

    需要查看告警详情时,单击“查看帮助”进行查看(MRS 3.x及之后版本支持)。

  1. 单击“高级搜索”显示告警搜索区域,设置查询条件后,单击“搜索”,查看指定的告警信息。单击“重置”清除输入的搜索条件。

    “起止时间”表示时间范围的开始时间和结束时间,可以搜索此时间段内产生的告警。

    查看“告警参考”章节告警帮助,按照帮助指导处理告警。如果某些场景中告警由于MRS依赖的其他云服务产生,可能需要联系对应云服务运维人员处理。

  2. 处理完告警后,若需手动清除,单击“清除告警”,在弹出的对话框单击“确定”,手动清除告警。

    如果有多个告警已完成处理,可选中一个或多个待清除的告警,单击“清除告警”,批量清除告警。每次最多批量清除300条告警。

support.huaweicloud.com/usermanual-mrs/zh-cn_topic_0040980162.html