搜索_华为云

ALM-19022 HBase热点检测功能不可用 - MapReduce服务 MRS

ALM-19022 HBase热点检测功能不可用告警解释 HBase服务安装MetricController实例时，告警模块按120秒周期检测HBase MetricController主实例健康状态。当HBase MetricController主实例不存在或不可用时，热点检测功能不可用，上报该告警。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
检测Yarn内存使用情况 - MapReduce服务 MRS

检测Yarn内存使用情况配置场景针对所提交应用的内存使用无法预估的情况，可以通过修改服务端的配置项控制是否对内存使用进行检测。若不检测内存使用，Container会占用内存直到内存溢出；若检测内存使用，当内存使用超过配置的内存大小时，相应的Container会被kill掉。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn运维管理
检测Yarn内存使用情况 - MapReduce服务 MRS

检测Yarn内存使用情况配置场景针对所提交应用的内存使用无法预估的情况，可以通过修改服务端的配置项控制是否对内存使用进行检测。如果不检测内存使用，Container会占用内存直到内存溢出；如果检测内存使用，当内存使用超过配置的内存大小时，相应的Container会被kill掉。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn运维管理
ALM-12045 网络读包丢包率超过阈值 - MapReduce服务 MRS

ALM-12045 网络读包丢包率超过阈值告警解释系统每30秒周期性检测网络读包丢包率，并把实际丢包率和阈值（系统默认阈值0.5%）进行比较，当检测到网络读包丢包率连续多次（默认值为5）超过阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-17009 Oozie连接DBService状态异常 - MapReduce服务 MRS

Oozie连接DBService状态异常告警解释 Oozie会依赖DBService，提交任务后系统会检测DBService连接状态，当检测到与DBService的连接状态连续10次异常时，产生该告警。当检测到Oozie连接DBService状态正常时，告警清除。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-25004 LdapServer数据同步异常 - MapReduce服务 MRS

告警解释系统按30秒周期性检测LdapServer数据，如果连续12次检测，Manager的主备LdapServer的数据内容都不一致，产生该告警，当两者的数据一致时，对应告警恢复。系统按30秒周期性检测LdapServer数据，如果连续12次检测，集群中的LdapServe

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12188 diskmgt磁盘监控服务不可用 - MapReduce服务 MRS

产生告警的主机名。对系统的影响 diskmgt磁盘监控服务不可用时，影响系统对磁盘信息和分区信息的监控，如设备分区文件系统只读检测、设备分区丢失检测、磁盘分区扩容检测等。可能原因 diskmgt磁盘监控服务不存在。 diskmgt磁盘监控服务未启动。处理步骤检查diskmgt磁盘监控服务是否存在。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14006 HDFS文件数超过阈值 - MapReduce服务 MRS

ALM-14006 HDFS文件数超过阈值告警解释系统每30秒周期性检测HDFS文件数，并把实际文件数和阈值相比较。当检测到HDFS文件数指标超出阈值范围时产生该告警。平滑次数为1，HDFS文件数指标的值小于或等于阈值时，告警恢复；平滑次数大于1，HDFS文件数指标的值小于或等于阈值的90%时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19007 HBase GC时间超出阈值 - MapReduce服务 MRS

ALM-19007 HBase GC时间超出阈值告警解释系统每60秒周期性检测HBase服务的老年代GC时间，当检测到HBase服务的老年代GC时间超出阈值（默认连续3次检测超过5秒）时产生该告警。在FusionInsight Manager首页，用户可通过选择“运维 > 告警

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-17010 Oozie连接HDFS状态异常 - MapReduce服务 MRS

ALM-17010 Oozie连接HDFS状态异常告警解释 Oozie会依赖HDFS，提交任务后系统会检测HDFS连接状态，当检测到与HDFS的连接状态连续3次异常时，产生该告警。当检测到Oozie连接HDFS状态正常时，告警清除。告警属性告警ID 告警级别是否可自动清除 17010

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43009 JobHistory GC 时间超出阈值（2.x及以前版本） - MapReduce服务 MRS

JobHistory GC 时间超出阈值（2.x及以前版本）告警解释系统每60秒周期性检测JobHistory进程的GC时间，当检测到JobHistory进程的GC时间超出阈值(连续3次检测超过12秒)时产生该告警。用户可通过“系统设置 > 阈值配置 > 服务 > Spark

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12104 knox资源异常 - MapReduce服务 MRS

ALM-12104 knox资源异常告警解释 HA每70秒周期性检测Manager的knox资源。当HA连续3次检测到knox资源异常时，产生该告警。当HA检测到knox资源正常后，告警恢复。告警属性告警ID 告警级别是否自动清除 12104 重要是告警参数参数名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45425 ClickHouse服务不可用 - MapReduce服务 MRS

ALM-45425 ClickHouse服务不可用告警解释告警模块按60秒周期检测ClickHouse实例状态，当检测到所有ClickHouse实例异常时，系统产生此告警。当系统检测到任一ClickHouse实例恢复正常，且告警处理完成时，告警恢复。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45615 CDL服务不可用 - MapReduce服务 MRS

ALM-45615 CDL服务不可用告警解释系统每60秒周期检测CDL健康状态，当检测到CDL健康状态为DOWN时，系统产生此告警。当系统检测到CDL健康状态为UP，告警恢复。告警属性告警ID 告警级别是否自动清除 45615 紧急是告警参数参数名称参数含义来源

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-17011 Oozie连接Yarn状态异常 - MapReduce服务 MRS

ALM-17011 Oozie连接Yarn状态异常告警解释 Oozie会依赖Yarn，提交任务后系统会检测Yarn连接状态，当检测到与Yarn的连接状态连续5次异常时，产生该告警。当检测到Oozie连接Yarn状态正常时，告警清除。告警属性告警ID 告警级别是否可自动清除 17011

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-50201 Doris服务不可用 - MapReduce服务 MRS

ALM-50201 Doris服务不可用告警解释告警模块按60秒周期检测Doris服务状态，当检测到所有FE和BE实例异常时，系统产生此告警。当系统检测到任意FE或BE实例恢复正常，告警恢复。告警属性告警ID 告警级别是否可自动清除 50201 紧急是告警参数参数名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45275 Ranger服务不可用 - MapReduce服务 MRS

ALM-45275 Ranger服务不可用告警解释告警模块按180秒周期检测Ranger服务状态，当检测到Ranger服务异常时，系统产生此告警。当系统检测到Ranger服务恢复正常，且告警处理完成时，告警恢复。告警属性告警ID 告警级别是否自动清除 45275 紧急

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45441 ZooKeeper连接断开 - MapReduce服务 MRS

ZooKeeper连接断开告警解释系统每分钟检测一次ClickHouse和ZooKeeper的连接情况，如果检测连接失败，系统产生告警（告警原因为ZooKeeper连接异常）。如果连续3次检测连接失败，系统产生告警（告警原因为ZooKeeper连接断开）。当系统检测到有一次连接成功，告警自动清除。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45446 ClickHouse的mutation任务长时间未执行完成 - MapReduce服务 MRS

本章节仅适用于MRS 3.3.1及之后版本。告警解释系统每隔5分钟检测一次mutation任务，当检测到有正在执行的mutation任务且运行时间大于等于阈值slow_mutation_cost_time时，系统产生告警；当没有检测到正在运行的mutation任务或mutation任务运行

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29000 Impala服务不可用 - MapReduce服务 MRS

ALM-29000 Impala服务不可用告警解释以30s为周期检测Impala服务状态，当检测到Impala服务异常时，系统产生此告警。当系统检测到Impala服务恢复正常，或告警处理完成时，告警解除。告警属性告警ID 告警级别是否可自动清除 29000 紧急是告警参数

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 677

上一页
1
2
3
4
5
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消