云服务器内容精选

华为云首页用户手册

MRS集群告警处理参考

MAPREDUCE服务 MRS-ALM-19012 HBase系统表目录或文件丢失:告警解释

告警解释系统按120秒周期性检测HBase在HDFS上的如下目录和文件是否存在，当检测到文件或者目录不存在时，上报该告警。当文件或目录都恢复后，告警恢复。检查内容：命名空间hbase在HDFS上的目录。 hbase.version文件。 hbase:meta表在HDFS上的目录、.tableinfo和.regioninfo文件。 hbase:namespace表在HDFS上的目录、.tableinfo和.regioninfo文件。 hbase:hindex表在HDFS上的目录、.tableinfo和.regioninfo文件。 hbase:acl表在HDFS上的目录、.tableinfo和.regioninfo文件(该表在普通模式集群默认不存在)。

MAPREDUCE服务 MRS MRS集群告警处理参考
MAPREDUCE服务 MRS-ALM-12042 关键文件配置异常（2.x及以前版本）:参考信息

参考信息 “/etc/fstab”检查文件的检查标准检查“/etc/fstab”文件中配置的分区，是否在“/proc/mounts”中能找到，另外再检查在“fstab”中配置的swap分区，是否和“/proc/swaps”一一对应。 “/etc/hosts”检查文件的检查标准通过命令cat /etc/hosts查看是否存在以下几种情况，如果是，则说明该配置文件配置异常。 “/etc/hosts”文件不存在。该主机的主机名不在文件中配置。该主机名对应的IP不唯一。该主机名对应的IP在ipconfig列表中不存在。该文件中存在一个IP对应多个主机名的情况。

MAPREDUCE服务 MRS MRS集群告警处理参考
MAPREDUCE服务 MRS-ALM-12015 设备分区文件系统只读（2.x及以前版本）:处理步骤

处理步骤登录 MRS 集群详情页面，选择“告警管理”。在实时告警列表中，单击此告警所在行。在“告警详情”区域，从“定位信息”中获取“HostName”和“PartitionName”，其中“HostName”为故障告警的节点，“PartitionName”为故障磁盘的分区。联系硬件工程师确认为磁盘硬件故障之后，将服务器上故障磁盘在线拔出。拔出磁盘后系统会上报“ALM-12014 分区丢失”告警，参考ALM-12014 设备分区丢失（2.x及以前版本）进行处理，处理完成后，本告警即可自动消除。

MAPREDUCE服务 MRS MRS集群告警处理参考
MAPREDUCE服务 MRS-ALM-27005 数据库连接数使用率超过阈值:告警解释

告警解释系统每30秒周期性检查DBServer节点的数据库连接数使用率，并把实际数据库连接数使用率和阈值相比较，当数据库连接数的使用率连续5次（可配置，默认值为5）超过设定阈值时，系统将产生此告警，数据库连接数使用率的阈值设为90%（可配置，默认值为90%）。平滑次数可配置，当平滑次数为1，数据库连接数使用率小于或等于阈值时，该告警恢复；当平滑次数大于1，数据库连接数使用率小于或等于阈值的90%时，该告警恢复。

MAPREDUCE服务 MRS MRS集群告警处理参考