搜索_华为云

无业务情况下，RegionServer占用CPU高 - MapReduce服务 MRS

无业务情况下，RegionServer占用CPU高问题背景无业务情况下，RegionServer占用CPU较高。原因分析通过top命令获取RegionServer的进程使用CPU情况信息，查看CPU使用率高的进程号。根据RegionServer的进程编号，获取该进程下线程使用CPU情况。 top -H

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
ALM-12201 进程CPU使用率超过阈值 - MapReduce服务 MRS

产生告警的集群或系统名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。附加信息触发条件告警触发的条件。对系统的影响业务延迟：主机CPU使用率过高时，可能会导致业务进程运行处理缓慢、业务延迟。业务失败：主机CPU使用率过高时，可能会导

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29106 Tserver进程CPU占用率过高 - MapReduce服务 MRS

ALM-29106 Tserver进程CPU占用率过高告警解释系统每60秒周期性检测Kudu的服务状态，当检测到Kudu Tserver进程CPU占用率过高时，此时产生该告警。 Tserver进程CPU占用率正常时，系统认为Kudu实例服务恢复，告警清除。告警属性告警ID

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12028 主机D状态和Z状态进程数超过阈值 - MapReduce服务 MRS

ALM-12028 主机D状态和Z状态进程数超过阈值告警解释系统每30秒周期性检测主机中omm用户D状态和Z状态进程数，并把实际进程数和阈值相比较。主机D状态和Z状态进程数默认提供一个阈值范围。当检测到进程数超出阈值范围时产生该告警。平滑次数为1，主机中omm用户D状态和Z状态进程总数小

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
PMS进程占用内存高 - MapReduce服务 MRS

grep =pmsd |grep -v grep 执行如下命令关闭PMS进程，其中PID为2中获取的PMS进程号。 kill -9 PID 等待PMS进程自动启动。 PMS启动需要2~3分钟。PMS是监控进程，重启不影响大数据业务。父主题：集群管理类

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ALM-12028 主机D状态进程数超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-12028 主机D状态进程数超过阈值（2.x及以前版本）告警解释系统每30秒周期性检测主机中omm用户D状态进程数，并把实际进程数和阈值相比较。主机D状态进程数默认提供一个阈值。当检测到进程数超出阈值时产生该告警。当主机中omm用户D状态进程数小于或等于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Knox进程占用内存高 - MapReduce服务 MRS

Knox进程占用内存高用户问题 knox进程占用内存高。问题现象主Master节点内存使用率高，用top -c命令查看到占用内存较高的进程中有knox进程，且此进程占用内存超过4 GB。原因分析 knox进程没有单独配置内存，进程会自动根据系统内存大小按照比例划分可用内存，导致knox占用内存大。

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ALM-12016 CPU使用率超过阈值 - MapReduce服务 MRS

对系统的影响业务延迟：主机CPU使用率过高时，可能会导致业务进程运行处理缓慢、业务延迟。业务失败：主机CPU使用率过高时，可能会导致业务处理缓慢、超时、失败，可能会导致作业运行失败。可能原因告警阈值配置或者平滑次数配置不合理。 CPU配置无法满足业务需求，CPU使用率达到上限。或

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-16005 Hive服务进程堆内存使用超出阈值 - MapReduce服务 MRS

告警级别是否自动清除 16005 重要是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-50205 BE CPU使用率超过阈值 - MapReduce服务 MRS

ALM-50205 BE CPU使用率超过阈值告警解释系统每30秒周期性检测BE CPU使用率。当检测到CPU使用率连续多次（默认值为3）超出阈值范围（默认值为95%）时产生该告警。平滑次数为1，CPU使用率小于或等于阈值时，告警恢复；平滑次数大于1，CPU使用率小于或等于阈值的85%时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置进程参数 - MapReduce服务 MRS

配置进程参数操作场景 Spark on YARN模式下，有Driver、ApplicationMaster、Executor三种进程。在任务调度和运行的过程中，Driver和Executor承担了很大的责任，而ApplicationMaster主要负责container的启停。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
进程被终止如何定位原因 - MapReduce服务 MRS

进程被终止如何定位原因问题背景与现象在某环境出现DataNode异常重启，且确认此时未从页面做重启DataNode的操作，需要定位是什么进程终止了DataNode服务端进程。原因分析常见的进程被异常终止有2种原因： Java进程OOM被终止一般Java进程都会配置OOM

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ALM-16006 Hive服务进程直接内存使用超出阈值 - MapReduce服务 MRS

告警级别是否自动清除 16006 重要是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12100 AD服务器连接异常 - MapReduce服务 MRS

产生告警的集群或系统名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响 AD服务不可用，AD域用户同步失败；AD域用户登录FusionInsight Manager失败，AD域用户执行业务失败。可能原因对接第三方AD服务配置项错误 F

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Flume服务端进程故障 - MapReduce服务 MRS

Flume服务端进程故障问题现象 Flume运行一段时间后，Manager界面Flume实例显示运行状态“故障”。原因分析 Flume文件或文件夹权限异常，重启后Manager界面提示如下信息： [2019-02-26 13:38:02]RoleInstance prepare

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Flume
配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据操作场景本章节适用于MRS 3.x及后续版本。用户在部署集群前，可根据需要规划Network File System（简称NFS）服务器，用于存储NameNode元数据，以提高数据可靠性。如果您已经部署NFS服务器，并已配置NFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
ALM-12037 NTP服务器异常 - MapReduce服务 MRS

联系NTP服务器的服务商，解决NTP服务器异常。确保NTP服务器正常后检查告警是否恢复。是，处理完毕。否，执行10。检查从NTP服务器获取的时间是否持续未更新。继续查看告警附加信息，是否提示从NTP服务器获取时间持续未更新。是，执行11。否，执行12。联系NTP服务器的服务商，解决NTP服务器异常

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Kafka Broker上报进程异常，日志提示“IllegalArgumentException” - MapReduce服务 MRS

Broker上报进程异常，日志提示“IllegalArgumentException” 问题背景与现象使用Manager提示进程故障告警，查看告警进程为Kafka Broker。可能原因 Broker配置异常。原因分析在Manager页面，在告警页面得到主机信息。通过SSH登录Kafka

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
MRS服务如何对接云日志服务？ - MapReduce服务 MRS

创建主机组，把1中已安装的ICAgent的主机加到主机组里面。在云日志服务管理控制台，单击“主机管理”，进入主机管理页面，单击右上角“新建主机组”。在弹出的新建主机组页面，输入“主机组名称”，选择主机类型“Linux主机”或“Windows主机”。在列表中选择需要加入该主机组的主机，单击“确定”，完成主机组的创建。

帮助中心 > MapReduce服务 MRS > 常见问题 > 周边生态对接类
修改MRS集群NTP服务器 - MapReduce服务 MRS

请准备新的NTP服务器并获取IP地址，并设置好集群与新NTP服务器的网络。请确保服务器的NTP服务状态正常，否则将导致本章节操作失败。修改MRS集群NTP服务器对系统的影响更换NTP服务器是高危操作，更换后集群时间可能将会变化。更换NTP服务器前NTP服务器与集群当前时间偏差大于150s，则需先停止集群，防止数据丢失。停止集群期间服务无法访问。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群

总条数： 2250

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

无业务情况下，RegionServer占用CPU高 - MapReduce服务 MRS

ALM-12201 进程CPU使用率超过阈值 - MapReduce服务 MRS

ALM-29106 Tserver进程CPU占用率过高 - MapReduce服务 MRS

ALM-12028 主机D状态和Z状态进程数超过阈值 - MapReduce服务 MRS

PMS进程占用内存高 - MapReduce服务 MRS

ALM-12028 主机D状态进程数超过阈值（2.x及以前版本） - MapReduce服务 MRS

Knox进程占用内存高 - MapReduce服务 MRS

ALM-12016 CPU使用率超过阈值 - MapReduce服务 MRS

ALM-16005 Hive服务进程堆内存使用超出阈值 - MapReduce服务 MRS

ALM-50205 BE CPU使用率超过阈值 - MapReduce服务 MRS

配置进程参数 - MapReduce服务 MRS

进程被终止如何定位原因 - MapReduce服务 MRS

ALM-16006 Hive服务进程直接内存使用超出阈值 - MapReduce服务 MRS

ALM-12100 AD服务器连接异常 - MapReduce服务 MRS

Flume服务端进程故障 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

ALM-12037 NTP服务器异常 - MapReduce服务 MRS

Kafka Broker上报进程异常，日志提示“IllegalArgumentException” - MapReduce服务 MRS

MRS服务如何对接云日志服务？ - MapReduce服务 MRS

修改MRS集群NTP服务器 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线