-
ALM-18011 NodeManager进程垃圾回收(GC)时间超过阈值
> 全部配置 > NodeManager > 系统”。将“GC_OPTS”参数根据实际情况调大。 集群中的NodeManager实例数量和NodeManager内存大小的对应关系参考如下: 集群中的NodeManager实例数量达到100,NodeManager实例的JVM参数建议配置为:-Xms2G
来自:帮助中心 -
ALM-18014 NodeManager直接内存使用率超过阈值
区域右上角的下拉菜单,选择“定制 > 资源”,勾选“NodeManager内存使用率”。查看直接内存使用情况。 图1 定制NodeManager内存使用率 查看NodeManager使用的直接内存是否已达到NodeManager设定的最大直接内存的90%(默认阈值)。 是,执行4。
来自:帮助中心 -
ALM-18018 NodeManager堆内存使用率超过阈值
表区域右上角的下拉菜单,选择“定制 > 资源”,勾选“NodeManager内存使用率”。查看堆内存使用情况。 图1 定制NodeManager内存使用率 查看NodeManager使用的堆内存是否已达到NodeManager设定的最大堆内存的95%(默认阈值)。 是,执行4。 否,执行6。
来自:帮助中心 -
ALM-18002 NodeManager心跳丢失(2.x及以前版本)
对系统的影响 丢失的NodeManager节点无法提供Yarn服务。 容器减少,集群性能下降。 可能原因 NodeManager没有经过退服操作,强制被删除。 NodeManager所有实例被停止或者进程故障。 NodeManager节点所在主机故障。 NodeManager和Resou
来自:帮助中心 -
ALM-18003 NodeManager不健康(2.x及以前版本)
-
ALM-18004 NodeManager磁盘可用率低于阈值(2.x及以前版本)
-
Superior调度模式下,单个NodeManager故障可能导致MapReduce任务失败
-
在Spark应用执行过程中NodeManager出现OOM异常
-
在Spark应用执行过程中NodeManager出现OOM异常
-
Superior调度模式下,单个NodeManager故障可能导致MapReduce任务失败
-
当一个NodeManager处于unhealthy的状态10分钟时,新应用程序失败
-
当一个NodeManager处于unhealthy的状态10分钟时,新应用程序失败
-
手动指定运行Yarn任务的用户
-
课程9:MapReuduce应用开发-开放接口介绍
-
Password cannot be null if SASL is enabled异常
造成该现象的原因是NodeManager重启。使用ExternalShuffle的时候,Spark将借用NodeManager传输Shuffle数据,因此NodeManager的内存将成为瓶颈。 在当前版本的 FusionInsight 中,NodeManager的默认内存只有1G,
来自:帮助中心 -
重启YARN,本地日志不被删除
-
手动指定运行Yarn任务的用户
-
重启YARN,本地日志不被删除
-
缩容Task节点失败
-
Password cannot be null if SASL is enabled异常
-
配置ResourceManager重启后自动加载Container信息