-
ALM-12053 文件句柄使用率超过阈值(2.x及以前版本) - MapReduce服务 MRS
告警属性 告警ID 告警级别 可自动清除 12053 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。
-
ALM-14004 损坏的HDFS块数量超过阈值(2.x及以前版本) - MapReduce服务 MRS
告警属性 告警ID 告警级别 可自动清除 14004 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。
-
ALM-27004 DBService主备数据不同步(2.x及以前版本) - MapReduce服务 MRS
告警属性 告警ID 告警级别 可自动清除 27004 致命 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。
-
执行Spark Core应用,尝试收集大量数据到Driver端,当Driver端内存不足时,应用挂起不退出 - MapReduce服务 MRS
执行Spark Core应用,尝试收集大量数据到Driver端,当Driver端内存不足时,应用挂起不退出 问题 执行Spark Core应用,尝试收集大量数据到Driver端,当Driver端内存不足时,应用挂起不退出,日志内容如下。 16/04/19 15:56:22 ERROR
-
ALM-16001 Hive数据仓库空间使用率超过阈值(2.x及以前版本) - MapReduce服务 MRS
登录MRS集群详情页面,单击“组件管理 > Hive > 服务配置”,将“基础配置”切换为“全部配置”,然后查找“hive.metastore.warehouse.size.percent”,调大该配置项。
-
ALM-43012 JDBCServer进程直接内存使用超出阈值(2.x及以前版本) - MapReduce服务 MRS
告警属性 告警ID 告警级别 可自动清除 43012 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。
-
ALM-44006 Presto Worker进程垃圾收集时间超出阈值(2.x及以前版本) - MapReduce服务 MRS
告警属性 告警ID 告警级别 可自动清除 44006 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。
-
当初始Executor为0时,为什么INSERT INTO/LOAD DATA任务分配不正确,打开的task少于可用的Executor? - MapReduce服务 MRS
当初始Executor为0时,为什么INSERT INTO/LOAD DATA任务分配不正确,打开的task少于可用的Executor? 问题 当初始Executor为0时,为什么INSERT INTO/LOAD DATA任务分配不正确,打开的task少于可用的Executor?
-
ALM-12032 ommdba用户或密码即将过期(2.x及以前版本) - MapReduce服务 MRS
告警属性 告警ID 告警级别 可自动清除 12032 次要 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。
-
ALM-12045 网络读包丢包率超过阈值(2.x及以前版本) - MapReduce服务 MRS
告警属性 告警ID 告警级别 可自动清除 12045 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。 NetworkCardName 产生告警的网口名。
-
ALM-12051 磁盘Inode使用率超过阈值(2.x及以前版本) - MapReduce服务 MRS
告警属性 告警ID 告警级别 可自动清除 12051 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。 PartitionName 产生告警的磁盘分区。
-
ALM-13001 ZooKeeper可用连接数不足(2.x及以前版本) - MapReduce服务 MRS
告警属性 告警ID 告警级别 可自动清除 13001 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。
-
ALM-18006 执行MapReduce任务超时(2.x及以前版本) - MapReduce服务 MRS
检查Yarn服务状态。 登录MRS集群详情页面,选择“告警管理”。 在告警列表中,查看是否有“ALM-18000 Yarn服务不可用”产生。 是,执行2.c。 否,执行3。 参考ALM-18000 Yarn服务不可用(2.x及以前版本)的处理步骤处理该故障。
-
ALM-43006 JobHistory进程堆内存使用超出阈值(2.x及以前版本) - MapReduce服务 MRS
单击“组件管理 > Spark > 服务配置 > 全部配置 > JobHistory > 默认”。将“SPARK_DAEMON_MEMORY”参数的值根据实际情况调大。 单击“保存配置”,勾选“重新启动受影响的服务或实例。”并单击“确定”。 观察界面告警是否清除。
-
ALM-12031 omm用户或密码即将过期(2.x及以前版本) - MapReduce服务 MRS
对系统的影响 omm用户或密码过期,Manager各节点互信不可用,无法对服务提供管理功能。 可能原因 系统omm用户或密码即将过期。 处理步骤 检查系统中omm用户和密码是否正常。 登录故障节点。
-
ALM-12046 网络写包丢包率超过阈值(2.x及以前版本) - MapReduce服务 MRS
告警属性 告警ID 告警级别 可自动清除 12046 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。 NetworkCardName 产生告警的网口名。
-
ALM-12052 TCP临时端口使用率超过阈值(2.x及以前版本) - MapReduce服务 MRS
告警属性 告警ID 告警级别 可自动清除 12052 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。
-
ALM-14012 HDFS Journalnode数据不同步(2.x及以前版本) - MapReduce服务 MRS
告警属性 告警ID 告警级别 可自动清除 14012 严重 是 告警参数 参数名称 参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 IP 产生告警的JournalNode实例的业务IP地址。
-
ALM-25004 LdapServer数据同步异常(2.x及以前版本) - MapReduce服务 MRS
单击“服务管理 > LdapServer > 服务配置”,记录LdapServer的端口号为PORT(若告警定位信息中的IP地址为oms备节点IP地址,则端口号为默认端口21750)。
-
MapReduce访问多组件样例程序开发思路 - MapReduce服务 MRS
MapReduce访问多组件样例程序开发思路 场景说明 该样例以MapReduce访问HDFS、HBase、Hive为例,介绍如何编写MapReduce作业访问多个服务组件。帮助用户理解认证、配置加载等关键使用方式。