搜索_华为云

ALM-29012 Impalad 正在等待的查询总数超过阈值 - MapReduce服务 MRS

ALM-29012 Impalad 正在等待的查询总数超过阈值告警解释以60s为周期检测该Impalad节点正在等待的查询总数，当检测到的数量超过自定义阈值（默认150）时，系统产生此告警。当系统检测到的数量减少到阈值以下时，告警将自动解除。告警属性告警ID 告警级别是否自动清除

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45439 ClickHouse节点进入只读模式 - MapReduce服务 MRS

是否可自动清除 45439 重要是告警参数参数名称参数含义来源产生告警的集群或系统名称服务名产生告警的服务名称角色名产生告警的角色名称主机名产生告警的主机名磁盘路径产生告警的磁盘路径对系统的影响 ClickHouseServer节点进入只读模式后所有写入、修改、删除操作均执行失败。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45744 Guardian TokenServer RPC处理平均时间超过阈值 - MapReduce服务 MRS

参数名称参数含义定位信息来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名称。附加信息 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 Guardian TokenSer

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45443 集群存在慢SQL查询 - MapReduce服务 MRS

告警参数参数名称参数含义来源产生告警的集群或系统名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响 ClickHouse服务的性能下降，影响其他业务的响应时间，若慢SQL的量过大，可能会导致服务不可用。可能原因 ClickHouse业务压力过大。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14003 丢失的HDFS块数量超过阈值 - MapReduce服务 MRS

ALM-14003 丢失的HDFS块数量超过阈值告警解释系统每30秒周期性检测丢失的块数量，并把丢失的块数量和阈值相比较。丢失的块数量指标默认提供一个阈值范围。当检测到丢失的HDFS块数量超出阈值范围时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > HDFS”修改阈值。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19036 HBase关键目录数据存在坏块 - MapReduce服务 MRS

HBase关键目录数据存在坏块告警解释系统每5分钟周期性检测HBase服务的关键目录是否存在坏块，当检测到存在坏块时产生该告警。检查内容包括“hbase.version”文件、hbase:meta和master:store表目录。当系统检测到HBase服务的关键目录都不存在坏块时，告警清除。该告警仅适用于MRS

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45740 TokenServer垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 Guardian TokenServer

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43017 JDBCServer2x进程Full GC次数超出阈值 - MapReduce服务 MRS

来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 GC次数超出阈值，会影响JDBCServer2x进程运行的性能，甚至造成

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12069 aos资源异常 - MapReduce服务 MRS

告警解释 HA每81秒周期性检测Manager的AOS资源。当HA连续2次检测到AOS资源异常时，产生该告警。当HA检测到AOS资源正常后，告警恢复。 AOS资源为单主资源，一般资源异常会导致主备倒换，看到告警时，基本已经主备倒换，并在新主环境上启动新的ACS资源，告警恢复。该告

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-13009 ZooKeeper Znode容量使用率超出阈值 - MapReduce服务 MRS

size”即“ZooKeeper目录的容量配额的最大值”，单位为Byte。然后搜索“GC_OPTS”配置项，查看其中“Xmx”的值。比较“max.data.size”和“Xmx*0.65”的值的大小，较小的值乘以80%为ZooKeeper Znode容量的阈值，可适当修改这两项配置，增大阈值。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29010 Impalad 正在提交的查询总数超过阈值 - MapReduce服务 MRS

ALM-29010 Impalad 正在提交的查询总数超过阈值告警解释以60s为周期检测该Impalad节点正在提交的查询总数，当检测到的数量超过自定义阈值（默认150）时，系统产生此告警。当系统检测到的数量减少到阈值以下时，告警将自动解除。告警属性告警ID 告警级别是否自动清除

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45738 TokenServer直接内存使用率超过阈值 - MapReduce服务 MRS

告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 Guardian TokenServer

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-25500 KrbServer服务不可用 - MapReduce服务 MRS

系统按30秒周期性检测组件KrbServer的服务状态。当检测到组件KrbServer服务异常时产生该告警。当检测到组件KrbServer服务恢复时告警恢复。告警属性告警ID 告警级别是否自动清除 25500 紧急是告警参数参数名称参数含义来源产生告警的集群名称。服务名

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29016 Impalad实例亚健康 - MapReduce服务 MRS

5版本：系统每60秒周期性检测Impalad的Hive Server2 HTTP端口（28000）是否响应curl请求，当返回结果不正确（连续2次检测超过20秒）时产生该告警，当curl请求在20秒内正确响应时，告警恢复。除MRS 3.1.5的其他版本：系统每60秒周期性检测Impalad是否能执行select

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45276 RangerAdmin状态异常 - MapReduce服务 MRS

告警级别是否自动清除 45276 重要是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响当存在单个RangerAdmin状态异常时，不影响Ranger原生UI访问；当两个

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
使用Share Lib工具检查Oozie依赖Jar包正确性 - MapReduce服务 MRS

”。根据检查结果进行异常处理。如果5的检测结果中包括缺失或已损坏的Jar包信息，需执行以下步骤进行处理： Spark Share Lib：上传“Spark客户端安装目录/spark/jars”路径下的Spark Jar包到检查结果对应的HDFS路径下： hdfs dfs -put

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > Oozie企业级能力增强
ALM-12002 HA资源异常（2.x及以前版本） - MapReduce服务 MRS

ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。 RESName 产生告警的资源名称。对系统的影响如果Manager的WebService浮动IP地址异常，用户无法登录和使用Manager。如果Manager的数据库异常，

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-25500 KrbServer服务不可用（2.x及以前版本） - MapReduce服务 MRS

ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。对系统的影响告警发生时，不能对集群中的组件KrbServer进行任何操作。其它组件的KrbServer认证将受影响。集群中依赖KrbServer的组件健康状态将为故障。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12067 tomcat资源异常 - MapReduce服务 MRS

HA每85秒周期性检测Manager的Tomcat资源。当HA连续2次都检测到Tomcat资源异常时，产生该告警。当HA检测到Tomcat资源正常后，告警恢复。 Tomcat资源为单主资源，一般资源异常会导致主备倒换，看到告警时，基本已经主备倒换，并在新主环境上启动新的Tomcat资

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12068 acs资源异常 - MapReduce服务 MRS

告警解释 HA每80秒周期性检测Manager的ACS资源。当HA连续2次都检测到ACS资源异常时，产生该告警。当HA检测到ACS资源正常后，告警恢复。 ACS资源为单主资源，一般资源异常会导致主备倒换，看到告警时，基本已经主备倒换，并在新主环境上启动新的ACS资源，告警恢复。该告

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 5784

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-29012 Impalad 正在等待的查询总数超过阈值 - MapReduce服务 MRS

ALM-45439 ClickHouse节点进入只读模式 - MapReduce服务 MRS

ALM-45744 Guardian TokenServer RPC处理平均时间超过阈值 - MapReduce服务 MRS

ALM-45443 集群存在慢SQL查询 - MapReduce服务 MRS

ALM-14003 丢失的HDFS块数量超过阈值 - MapReduce服务 MRS

ALM-19036 HBase关键目录数据存在坏块 - MapReduce服务 MRS

ALM-45740 TokenServer垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

ALM-43017 JDBCServer2x进程Full GC次数超出阈值 - MapReduce服务 MRS

ALM-12069 aos资源异常 - MapReduce服务 MRS

ALM-13009 ZooKeeper Znode容量使用率超出阈值 - MapReduce服务 MRS

ALM-29010 Impalad 正在提交的查询总数超过阈值 - MapReduce服务 MRS

ALM-45738 TokenServer直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-25500 KrbServer服务不可用 - MapReduce服务 MRS

ALM-29016 Impalad实例亚健康 - MapReduce服务 MRS

ALM-45276 RangerAdmin状态异常 - MapReduce服务 MRS

使用Share Lib工具检查Oozie依赖Jar包正确性 - MapReduce服务 MRS

ALM-12002 HA资源异常（2.x及以前版本） - MapReduce服务 MRS

ALM-25500 KrbServer服务不可用（2.x及以前版本） - MapReduce服务 MRS

ALM-12067 tomcat资源异常 - MapReduce服务 MRS

ALM-12068 acs资源异常 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线