搜索_华为云

ALM-14032 JournalNode进程状态异常 - MapReduce服务 MRS

产生告警的主机名。对系统的影响进程状态异常会导致该进程无法提供正常服务，进而可能导致服务整体异常。可能原因主机中正在等待的IO（磁盘IO、网络IO等）在较长时间内未得到响应，进程处于D状态和Z状态。或进程可能被挂起进入T状态。处理步骤查看进程是否处于D、Z、T状态登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12061 进程使用率超过阈值 - MapReduce服务 MRS

D”列为对应进程ID）是，在不影响业务的情况下，参考以下操作终止top5中异常使用进程的父进程。执行11。执行以下命令查询对应进程的父进程。 ps -ef | grep "进程ID" 查询出的第三列即为父进程ID。执行以下命令终止父进程。 kill -9 父进程ID 否，如

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18027 JobHistoryServer进程状态异常 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响进程状态异常会导致该进程无法提供正常服务，进而可能导致服务整体异常。可能原因主机中正在等待的IO（磁盘IO、网络IO等）在较长时间内未得到响应，进程处于D状态和Z状态。或进程可能被挂起进入T状态。处理步骤查看进程是否处于D、Z、T状态登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18028 TimeLineServer进程状态异常 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响进程状态异常会导致该进程无法提供正常服务，进而可能导致服务整体异常。可能原因主机中正在等待的IO（磁盘IO、网络IO等）在较长时间内未得到响应，进程处于D状态和Z状态。或进程可能被挂起进入T状态。处理步骤查看进程是否处于D、Z、T状态登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
集群运维 - MapReduce服务 MRS
集群运维 - MapReduce服务 MRS

集群运维告警管理 MRS可以实时监控大数据集群，通过告警和事件可以识别系统健康状态。同时MRS也支持用户自定义配置监控与告警阈值用于关注各指标的健康情况，当监控数据达到告警阈值，系统将会触发一条告警信息。 MRS还可以与华为云消息通知服务(SMN)的消息服务系统对接，将告警信息

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
ALM-12201 进程CPU使用率超过阈值 - MapReduce服务 MRS

ALM-12201 进程CPU使用率超过阈值告警解释系统每30秒周期性检测CPU使用率，并把实际CPU使用率和阈值相比较。当检测到CPU使用率连续多次（默认值为10）超出阈值范围时产生该告警。平滑次数为1，CPU使用率小于或等于阈值时，告警恢复；平滑次数大于1，CPU使用率小于或等于阈值的90%时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45432 ClickHouse用户同步进程故障 - MapReduce服务 MRS

ALM-45432 ClickHouse用户同步进程故障告警解释系统每5分钟周期性检测用户角色同步进程的状态，当检测到ClickHouse服务用户角色同步进程故障或者用户角色同步失败，产生该告警。当用户角色同步进程正常并且用户角色同步功能正常后，告警自动清除。告警属性告警ID

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29015 Catalog进程内存占用率超过阈值 - MapReduce服务 MRS

ALM-29015 Catalog进程内存占用率超过阈值告警解释以30s为周期检测Catalog进程系统内存占用率，当检测到的超过默认阈值（80%）时，系统产生此告警。当系统检测到进程内存占用率下降到阈值以下时，告警将自动解除。告警属性告警ID 告警级别是否自动清除 29015

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-17007 Oozie进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-17007 Oozie进程垃圾回收（GC）时间超过阈值告警解释系统每60秒周期性检测Oozie进程的垃圾回收（GC）占用时间，当检测到Oozie进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。告警属性告警ID

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12007 进程故障（2.x及以前版本） - MapReduce服务 MRS

ALM-12007 进程故障（2.x及以前版本）告警解释进程健康检查模块按5秒周期检测进程状态。当进程健康检查模块连续三次检测到进程连接状态为故障时，产生该告警。当进程连接正常时，告警恢复。告警属性告警ID 告警级别可自动清除 12007 严重是告警参数参数名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
OpenTSDB应用开发简介 - MapReduce服务 MRS

nTSDB的设计目标是用来采集大规模集群中的监控类信息，并可实现数据的秒级查询，解决海量监控类数据在普通数据库中查询存储的局限性。 OpenTSDB使用场景有如下几个特点：采集指标在某一时间点具有唯一值，没有复杂的结构及关系。监控的指标具有随着时间不断变化的特点。具有HBase的高吞吐，良好的伸缩性等特点。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > OpenTSDB开发指南 > OpenTSDB应用开发概述
ALM-12004 OLdap资源异常 - MapReduce服务 MRS

执行ps -ef | grep slapd，可以查看到有端口为21750的slapd进程。是，执行3。否，执行4。执行kill -2 ldap进程pid，等待20s以后，HA会自动启动OLdap进程。观察当前OLdap资源状态是否正常。是，操作结束。否，执行4。收集故障信息。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38005 Broker进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响 Broker进程的垃圾回收时间过长，可能影响该Broker进程正常提供服务。可能原因该节点Kafka实例进程的垃圾回收时间过长，或配置的直接内存大小不合理，导致进程GC频繁。处理步骤检查Broker进程的垃圾回收（GC）时间。在FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-13003 ZooKeeper进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-13003 ZooKeeper进程垃圾回收（GC）时间超过阈值告警解释系统每60秒周期性检测ZooKeeper进程的垃圾回收（GC）占用时间，当检测到ZooKeeper进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14014 NameNode进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-14014 NameNode进程垃圾回收（GC）时间超过阈值告警解释系统每60秒周期性检测NameNode进程的垃圾回收（GC）占用时间，当检测到NameNode进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14015 DataNode进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-14015 DataNode进程垃圾回收（GC）时间超过阈值告警解释系统每60秒周期性检测DataNode进程的垃圾回收（GC）占用时间，当检测到DataNode进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29004 Impalad进程内存占用率超过阈值 - MapReduce服务 MRS

ALM-29004 Impalad进程内存占用率超过阈值告警解释以30s为周期检测Impalad进程系统内存占用率，当检测到的超过默认阈值（80%）时，系统产生此告警。当系统检测到进程内存占用率下降到阈值以下时，告警将自动解除。告警属性告警ID 告警级别是否可自动清除

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-16006 Hive服务进程直接内存使用超出阈值 - MapReduce服务 MRS

择“定制 > CPU和内存”，勾选“HiveServer内存使用率统计” ，单击“确定”，查看HiveServer进程使用的直接内存是否已达到HiveServer进程设定的最大直接内存的阈值（默认95%）。是，执行4。否，执行7。图1 勾选HiveServer内存使用率统计

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45327 Presto Coordinator进程垃圾收集时间超出阈值 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响 Coordinator进程GC时间过长，会影响Coordinator进程运行的性能，甚至造成Coordinator进程不可用。可能原因该节点Coordinator进程堆内存使用率过大，或配置的堆内存不合理，导致进程GC频繁。处理步骤检查GC时间。在FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43009 JobHistory2x进程GC时间超出阈值 - MapReduce服务 MRS

GC时间超出阈值，会影响JobHistory2x进程运行的性能，甚至造成JobHistory2x进程不可用，进程不可用时仅会造成无法查询Spark任务历史执行记录。可能原因该节点JobHistory2x进程堆内存使用率过大，或配置的堆内存不合理，导致进程GC频繁。处理步骤检查GC时间在FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 1040

上一页
1
...
4
5
6
...
52
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-14032 JournalNode进程状态异常 - MapReduce服务 MRS

ALM-12061 进程使用率超过阈值 - MapReduce服务 MRS

ALM-18027 JobHistoryServer进程状态异常 - MapReduce服务 MRS

ALM-18028 TimeLineServer进程状态异常 - MapReduce服务 MRS

集群运维 - MapReduce服务 MRS

ALM-12201 进程CPU使用率超过阈值 - MapReduce服务 MRS

ALM-45432 ClickHouse用户同步进程故障 - MapReduce服务 MRS

ALM-29015 Catalog进程内存占用率超过阈值 - MapReduce服务 MRS

ALM-17007 Oozie进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-12007 进程故障（2.x及以前版本） - MapReduce服务 MRS

OpenTSDB应用开发简介 - MapReduce服务 MRS

ALM-12004 OLdap资源异常 - MapReduce服务 MRS

ALM-38005 Broker进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-13003 ZooKeeper进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-14014 NameNode进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-14015 DataNode进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-29004 Impalad进程内存占用率超过阈值 - MapReduce服务 MRS

ALM-16006 Hive服务进程直接内存使用超出阈值 - MapReduce服务 MRS

ALM-45327 Presto Coordinator进程垃圾收集时间超出阈值 - MapReduce服务 MRS

ALM-43009 JobHistory2x进程GC时间超出阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线