-
ALM-18017 NodeManager非堆内存使用率超过阈值
ALM-18017 NodeManager非堆内存使用率超过阈值 告警解释 系统每30秒周期性检测Yarn NodeManager非堆内存使用率,并把实际的Yarn NodeManager非堆内存使用率和阈值相比较。当Yarn NodeManager非堆内存使用率超出阈值(默认为最大非堆内存的90%)时产生该告警。
来自:帮助中心 -
ALM-18011 NodeManager进程垃圾回收(GC)时间超过阈值
> 全部配置 > NodeManager > 系统”。将“GC_OPTS”参数根据实际情况调大。 集群中的NodeManager实例数量和NodeManager内存大小的对应关系参考如下: 集群中的NodeManager实例数量达到100,NodeManager实例的JVM参数建议配置为:-Xms2G
来自:帮助中心 -
ALM-18018 NodeManager堆内存使用率超过阈值
表区域右上角的下拉菜单,选择“定制 > 资源”,勾选“NodeManager内存使用率”。查看堆内存使用情况。 图1 定制NodeManager内存使用率 查看NodeManager使用的堆内存是否已达到NodeManager设定的最大堆内存的95%(默认阈值)。 是,执行4。 否,执行6。
来自:帮助中心 -
ALM-18003 NodeManager不健康(2.x及以前版本)
系统当前指标取值满足自定义的告警设置条件。 对系统的影响 故障的NodeManager节点无法提供Yarn服务。 容器减少,集群性能下降。 可能原因 NodeManager节点所在主机的硬盘空间不足。 NodeManager节点本地目录omm用户无访问权限。 处理步骤 收集故障信息。
来自:帮助中心 -
ALM-18002 NodeManager心跳丢失(2.x及以前版本)
-
ALM-18004 NodeManager磁盘可用率低于阈值(2.x及以前版本)
-
在Spark应用执行过程中NodeManager出现OOM异常
-
Superior调度模式下,单个NodeManager故障可能导致MapReduce任务失败
-
在Spark应用执行过程中NodeManager出现OOM异常
-
Superior调度模式下,单个NodeManager故障可能导致MapReduce任务失败
-
当一个NodeManager处于unhealthy的状态10分钟时,新应用程序失败
-
当一个NodeManager处于unhealthy的状态10分钟时,新应用程序失败
-
手动指定运行Yarn任务的用户
-
手动指定运行Yarn任务的用户
-
Password cannot be null if SASL is enabled异常
造成该现象的原因是NodeManager重启。使用ExternalShuffle的时候,Spark将借用NodeManager传输Shuffle数据,因此NodeManager的内存将成为瓶颈。 在当前版本的 FusionInsight 中,NodeManager的默认内存只有1G,
来自:帮助中心 -
课程9:MapReuduce应用开发-开放接口介绍
-
Password cannot be null if SASL is enabled异常
-
重启YARN,本地日志不被删除
-
配置ResourceManager重启后自动加载Container信息
-
配置ResourceManager重启后自动加载Container信息
-
使用External Shuffle Service提升性能