检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
TagSync堆内存使用率超过阈值 告警解释 系统每60秒周期性检测TagSync服务堆内存使用状态,当连续10次检测到TagSync实例堆内存使用率超出阈值(最大内存的95%)时产生该告警,堆内存使用率小于阈值时,告警恢复。 告警属性 告警ID 告警级别 是否自动清除 45285
上角的下拉菜单,选择“定制 > CPU和内存 > PolicySync堆内存使用率”,单击“确定”。 图1 PolicySync堆内存使用率 查看PolicySync使用的堆内存是否已达到PolicySync设定的阈值(默认值为最大堆内存的95%)。 是,执行4。 否,执行6。 在FusionInsight
Spark任务由于内存不够或提交作业时未添加Jar包,作业卡住 用户问题 Spark提交作业内存不足或提交作业时未添加Jar包导致任务长时间处于pending状态或者运行中内存溢出。 问题现象 使用Spark提交作业后,长期卡住不动。反复运行作业后报错,内容如下: Exception
问题背景与现象 通过客户端提交任务,客户端返回内存溢出的报错结果: 原因分析 从报错堆栈可以看出是任务在提交过程中分片时在读取HDFS文件阶段内存溢出了,一般是由于该任务要读取的小文件很多导致内存不足。 解决办法 排查启动的MapReduce任务是否对应的HDFS文件个数很多,如果很多,
Impalad的xmx内存小于catalog的xmx内存,Impalad节点持续报Full GC,SQL一直处于created状态 问题 Impalad的xmx内存小于Catalog的xmx内存,catalog长期运行,内存已经超过了impalad的xmx 内存,Impalad节点持续报Full
Server直接内存使用率超过阈值 告警解释 系统每60秒周期性检测Flume服务直接内存使用状态,当连续5次检测到Flume实例直接内存使用率超出阈值(最大内存的80%)时,产生该告警。当Flume直接内存使用率小于或等于阈值时,告警恢复。 告警属性 告警ID 告警级别 是否自动清除 24007
实例”,选择上报告警实例主机名对应的角色,单击图表区域右上角的下拉菜单,选择“定制 > 内存”中的“Oozie非堆内存使用率”,单击“确定”。 图1 定制Oozie非堆内存使用率 查看Oozie使用的非堆内存是否已达到Oozie设定的阈值(默认值为最大非堆内存的80%)。 是,执行4。 否,执行6。 在FusionInsight
单,选择“定制 > 资源”,勾选“NodeManager内存使用率”。查看堆内存使用情况。 图1 定制NodeManager内存使用率 查看NodeManager使用的堆内存是否已达到NodeManager设定的最大堆内存的95%(默认阈值)。 是,执行4。 否,执行6。 在FusionInsight
拉菜单,选择“定制 > 进程 > Kafka堆内存使用率”,单击“确定”。 图1 Kafka堆内存使用率 查看Kafka使用的堆内存是否已达到Kafka设定的最大堆内存的95%。 是,执行4。 否,执行6。 检查Kafka配置的堆内存大小。 在FusionInsight Manager首页,选择“集群
quorumpeer(对应上报告警实例ip) > 定制 > ZooKeeper堆内存与直接内存资源状况”。查看堆内存使用情况。 查看ZooKeeper使用的堆内存是否已达到ZooKeeper设定的最大堆内存的百分之80? 是,执行1.d。 否,执行1.f。 在MRS Manager首页,单击“服务管理
Flume Server堆内存使用率超过阈值 告警解释 系统每60秒周期性检测Flume服务堆内存使用状态,当连续10次检测到Flume实例堆内存使用率超出阈值(最大内存的95%)时产生该告警,堆内存使用率小于阈值时,告警恢复。 告警属性 告警ID 告警级别 是否自动清除 24006 重要
域右上角的下拉菜单,选择“定制 > CPU和内存 > UserSync非堆内存使用率”,单击“确定”。 图1 UserSync非堆内存使用率 查看UserSync使用的非堆内存是否已达到UserSync设定的阈值(默认值为最大非堆内存的80%)。 是,执行4。 否,执行6。 在FusionInsight
优化Flink内存GC参数 操作场景 Flink是依赖内存计算,计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC(Garbage Collection),评估内存使用及剩余情况来判断内存是否变成性能瓶颈,并根据情况优化。 监控节点进程的YARN的Container
Flume Server非堆内存使用率超过阈值 告警解释 系统每60秒周期性检测Flume服务非堆内存使用状态,当连续5次检测到Flume实例非堆内存使用率超出阈值(最大内存的80%)时产生该告警,非堆内存使用率小于阈值时,告警恢复。 告警属性 告警ID 告警级别 是否自动清除 24008
拉菜单,选择“定制 > CPU和内存 > RangerAdmin非堆内存使用率”,单击“确定”。 图1 RangerAdmin非堆内存使用率 查看RangerAdmin使用的非堆内存是否已达到RangerAdmin设定的阈值(默认值为最大非堆内存的80%)。 是,执行4。 否,执行6。
OMS ”,查看监控图表中“OMS进程内存使用率”,根据告警产生时间查看对应进程的内存使用率是否已达到进程设定的最大内存的阈值(默认90%)。 如果无对应图表,可单击右侧下拉三角,选择“定制”并勾选对应项,单击“确定”。 是,执行3。 否,执行6。 联系运维人员修改对应进程的内存使用配置。
Hudi在upsert时占用了临时文件夹中大量空间。 回答 当UPSERT大量输入数据时,如果数据量达到合并的最大内存时,Hudi将溢出部分输入数据到磁盘。 如果有足够的内存,请增加spark executor的内存和添加“hoodie.memory.merge.fraction”选项,如: option("hoodie
Spark Core内存调优 操作场景 Spark是内存计算框架,计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC(Garbage Collection),评估内存中RDD的大小来判断内存是否变成性能瓶颈,并根据情况优化。 监控节点进程的GC情况(在客户端的conf/spark-default
UserSync堆内存使用率超过阈值 告警解释 系统每60秒周期性检测UserSync服务堆内存使用状态,当连续10次检测到UserSync实例堆内存使用率超出阈值(最大内存的95%)时产生该告警,堆内存使用率小于阈值时,告警恢复。 告警属性 告警ID 告警级别 是否自动清除 45281
ConfigNode直接内存使用率超过阈值 告警解释 系统每60秒周期性检测ConfigNode进程直接内存使用状态,当连续5次检测到ConfigNode实例直接内存使用率超出阈值时,产生该告警,即当前ConfigNode设置的直接内存无法满足当前ConfigNode进程所需的直接内存。当Con