搜索_华为云

ALM-45615 CDL服务不可用 - MapReduce服务 MRS

ALM-45615 CDL服务不可用告警解释系统每60秒周期检测CDL健康状态，当检测到CDL健康状态为DOWN时，系统产生此告警。当系统检测到CDL健康状态为UP，告警恢复。告警属性告警ID 告警级别是否自动清除 45615 紧急是告警参数参数名称参数含义来源

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-50201 Doris服务不可用 - MapReduce服务 MRS

ALM-50201 Doris服务不可用告警解释告警模块按60秒周期检测Doris服务状态，当检测到所有FE和BE实例异常时，系统产生此告警。当系统检测到任意FE或BE实例恢复正常，告警恢复。告警属性告警ID 告警级别是否可自动清除 50201 紧急是告警参数参数名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19020 HBase容灾等待同步的wal文件数量超过阈值 - MapReduce服务 MRS

名。检查主备集群RegionServer之间的网络连接。执行ping命令，查看故障RegionServer节点和备集群RegionServer所在主机的网络连接是否正常。是，执行5 否，执行3 联系网络管理员恢复网络。网络恢复后，在告警列表中，查看本告警是否清除。是，处理完毕。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-17009 Oozie连接DBService状态异常 - MapReduce服务 MRS

Oozie连接DBService状态异常告警解释 Oozie会依赖DBService，提交任务后系统会检测DBService连接状态，当检测到与DBService的连接状态连续10次异常时，产生该告警。当检测到Oozie连接DBService状态正常时，告警清除。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-29000 Impala服务不可用 - MapReduce服务 MRS

ALM-29000 Impala服务不可用告警解释以30s为周期检测Impala服务状态，当检测到Impala服务异常时，系统产生此告警。当系统检测到Impala服务恢复正常，或告警处理完成时，告警解除。告警属性告警ID 告警级别是否可自动清除 29000 紧急是告警参数

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HBase占用网络端口，连接数过大会导致其他服务不稳定 - MapReduce服务 MRS

HBase占用网络端口，连接数过大会导致其他服务不稳定问题 HBase占用网络端口，连接数过大会导致其他服务不稳定。回答使用操作系统命令lsof或者netstat发现大量TCP连接处于CLOSE_WAIT状态，且连接持有者为HBase RegionServer，可能导致网络端口耗尽

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase故障排除
ALM-19007 HBase GC时间超出阈值 - MapReduce服务 MRS

ALM-19007 HBase GC时间超出阈值告警解释系统每60秒周期性检测HBase服务的老年代GC时间，当检测到HBase服务的老年代GC时间超出阈值（默认连续3次检测超过5秒）时产生该告警。在FusionInsight Manager首页，用户可通过选择“运维 > 告警

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HBase占用网络端口，连接数过大会导致其他服务不稳定 - MapReduce服务 MRS

HBase占用网络端口，连接数过大会导致其他服务不稳定问题 HBase占用网络端口，连接数过大会导致其他服务不稳定。回答使用操作系统命令lsof或者netstat发现大量TCP连接处于CLOSE_WAIT状态，且连接持有者为HBase RegionServer，可能导致网络端口耗尽

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase故障排除
ALM-18002 NodeManager心跳丢失 - MapReduce服务 MRS

否，执行11。检查网络状态。登录管理节点，ping丢失的NodeManager节点的IP地址，检查网络是否断连或繁忙。管理节点的主备状态及对应IP地址可在FusionInsight Manager主机管理界面查看。是，执行12。否，执行13。修复网络故障，然后查看该告警是否恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43009 JobHistory GC 时间超出阈值（2.x及以前版本） - MapReduce服务 MRS

JobHistory GC 时间超出阈值（2.x及以前版本）告警解释系统每60秒周期性检测JobHistory进程的GC时间，当检测到JobHistory进程的GC时间超出阈值(连续3次检测超过12秒)时产生该告警。用户可通过“系统设置 > 阈值配置 > 服务 > Spark

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12015 设备分区文件系统只读 - MapReduce服务 MRS

ALM-12015 设备分区文件系统只读告警解释系统按60秒周期进行扫描，如果检测到挂载服务目录的设备分区变为只读模式（如设备有坏扇区、文件系统存在故障等原因），则触发此告警。系统如果检测到挂载服务目录的设备分区的只读模式消失（比如文件系统修复为读写模式、设备拔出、设备被重新格式化等原因），则告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
MRS集群节点使用pip3安装Python时提示网络不可达 - MapReduce服务 MRS

MRS集群节点使用pip3安装Python时提示网络不可达问题现象执行pip3 install安装Python时报错网络不可达。具体如下图所示：原因分析用户未给Master节点绑定弹性公网IP，造成报错的发生。处理步骤登录MRS服务管理控制台。选择“现有集群”，选

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ALM-45275 Ranger服务不可用 - MapReduce服务 MRS

ALM-45275 Ranger服务不可用告警解释告警模块按180秒周期检测Ranger服务状态，当检测到Ranger服务异常时，系统产生此告警。当系统检测到Ranger服务恢复正常，且告警处理完成时，告警恢复。告警属性告警ID 告警级别是否自动清除 45275 紧急

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45446 ClickHouse的mutation任务长时间未执行完成 - MapReduce服务 MRS

本章节仅适用于MRS 3.3.1及之后版本。告警解释系统每隔5分钟检测一次mutation任务，当检测到有正在执行的mutation任务且运行时间大于等于阈值slow_mutation_cost_time时，系统产生告警；当没有检测到正在运行的mutation任务或mutation任务运行

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43023 IndexServer2x进程Full GC次数超出阈值 - MapReduce服务 MRS

IndexServer2x进程Full GC次数超出阈值告警解释系统每60秒周期性检测IndexServer2x进程的Full GC次数，当检测到IndexServer2x进程的Full GC次数超出阈值（连续3次检测超过12次）时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > Spark2x

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45736 Guardian服务不可用 - MapReduce服务 MRS

Guardian服务不可用本章节仅适用于MRS 3.1.5及之后版本。告警解释告警模块按60秒周期检测Guardian服务状态，当检测到Guardian服务异常时，系统产生此告警。当系统检测到Guardian服务恢复正常，且告警处理完成时，告警恢复。告警属性告警ID 告警级别是否自动清除

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12070 controller资源异常 - MapReduce服务 MRS

ALM-12070 controller资源异常告警解释 HA每80秒周期性检测Manager的controller资源。当HA连续2次检测到controller资源异常时，产生该告警。当HA检测到controller资源正常后，告警恢复。 controller资源为单主资源

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12103 executor资源异常 - MapReduce服务 MRS

ALM-12103 executor资源异常告警解释 HA每30秒周期性检测Manager的executor资源。当HA连续2次检测到executor资源异常时，产生该告警。当HA检测到executor资源正常后，告警恢复。 executor资源为单主资源，一般资源异常会导致

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-17011 Oozie连接Yarn状态异常 - MapReduce服务 MRS

ALM-17011 Oozie连接Yarn状态异常告警解释 Oozie会依赖Yarn，提交任务后系统会检测Yarn连接状态，当检测到与Yarn的连接状态连续5次异常时，产生该告警。当检测到Oozie连接Yarn状态正常时，告警清除。告警属性告警ID 告警级别是否可自动清除 17011

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43009 JobHistory2x进程GC时间超出阈值 - MapReduce服务 MRS

ALM-43009 JobHistory2x进程GC时间超出阈值告警解释系统每60秒周期性检测JobHistory2x进程的GC时间，当检测到JobHistory2x进程的GC时间超出阈值（连续3次检测超过12秒）时产生该告警。用户可通过“运维 >告警 > 阈值设置 > Spark2x

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 1162

上一页
1
2
3
4
5
...
59
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-45615 CDL服务不可用 - MapReduce服务 MRS

ALM-50201 Doris服务不可用 - MapReduce服务 MRS

ALM-19020 HBase容灾等待同步的wal文件数量超过阈值 - MapReduce服务 MRS

ALM-17009 Oozie连接DBService状态异常 - MapReduce服务 MRS

ALM-29000 Impala服务不可用 - MapReduce服务 MRS

HBase占用网络端口，连接数过大会导致其他服务不稳定 - MapReduce服务 MRS

ALM-19007 HBase GC时间超出阈值 - MapReduce服务 MRS

HBase占用网络端口，连接数过大会导致其他服务不稳定 - MapReduce服务 MRS

ALM-18002 NodeManager心跳丢失 - MapReduce服务 MRS

ALM-43009 JobHistory GC 时间超出阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-12015 设备分区文件系统只读 - MapReduce服务 MRS

MRS集群节点使用pip3安装Python时提示网络不可达 - MapReduce服务 MRS

ALM-45275 Ranger服务不可用 - MapReduce服务 MRS

ALM-45446 ClickHouse的mutation任务长时间未执行完成 - MapReduce服务 MRS

ALM-43023 IndexServer2x进程Full GC次数超出阈值 - MapReduce服务 MRS

ALM-45736 Guardian服务不可用 - MapReduce服务 MRS

ALM-12070 controller资源异常 - MapReduce服务 MRS

ALM-12103 executor资源异常 - MapReduce服务 MRS

ALM-17011 Oozie连接Yarn状态异常 - MapReduce服务 MRS

ALM-43009 JobHistory2x进程GC时间超出阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线