搜索_华为云

ALM-16001 Hive数据仓库空间使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

x及以前版本）告警解释系统每30秒周期性检测Hive数据仓库空间使用率，该指标可在Hive服务监控界面查看，指标名称为“Hive已经使用的HDFS空间占可使用空间的百分比”。Hive数据仓库空间使用率指标默认提供一个阈值范围（85%），当检测到Hive数据仓库空间使用率超过阈值范围时产生该告警。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12012 NTP服务异常 - MapReduce服务 MRS

否，执行38。 chrony不能正常同步，通常与系统防火墙有关。如果能关闭防火墙，建议尝试关闭防火墙；如果不能关闭防火墙，请检查防火墙配置策略，确保UDP 123、323端口未禁用（具体遵循各系统下防火墙配置策略）。处理防火墙后等待10分钟，检查该告警是否恢复。是，处理完毕。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38011 Broker上用户连接数使用率超过设定阈值 - MapReduce服务 MRS

ALM-38011 Broker上用户连接数使用率超过设定阈值告警解释系统每30秒周期性检测Broker上每个用户的连接数情况，当连续5次检测到Broker上某个用户的连接数使用占比超过阈值（默认80%）时产生该告警。平滑次数为5，当Broker上某个用户的连接数使用占比低于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45337 Presto Worker3进程垃圾收集时间超出阈值 - MapReduce服务 MRS

Worker3进程垃圾收集时间超出阈值告警解释系统每30s周期性采集Presto Worker3进程的垃圾收集（GC）时间，当检测到GC时间超出阈值（连续3次检测超过5s）时产生该告警。当 Worker3进程GC时间小于或等于告警阈值时，告警清除。告警属性告警ID 告警级别是否自动清除

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19008 HBase服务进程堆内存使用率超出阈值 - MapReduce服务 MRS

ALM-19008 HBase服务进程堆内存使用率超出阈值告警解释系统每30秒周期性检测HBase服务堆内存使用状态，当检测到HBase服务堆内存使用率超出阈值（最大内存的90%）时产生该告警。告警属性告警ID 告警级别是否自动清除 19008 重要是告警参数参数名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12016 CPU使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-12016 CPU使用率超过阈值（2.x及以前版本）告警解释系统每30秒周期性检测CPU使用率，并把实际CPU使用率和阈值相比较。CPU使用率默认提供一个阈值。当检测到CPU使用率连续多次（可配置，默认值为10）超过该阈值时产生该告警。当平均CPU使用率小于或等于阈值的90%时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-13001 ZooKeeper可用连接数不足（2.x及以前版本） - MapReduce服务 MRS

ALM-13001 ZooKeeper可用连接数不足（2.x及以前版本）告警解释系统每30秒周期性检测ZooKeeper服务连接数状态，当检测到ZooKeeper实例连接数超出阈值（最大连接数的百分之八十）时产生该告警。连接数小于阈值时，告警恢复。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14024 租户空间使用率超过阈值 - MapReduce服务 MRS

ALM-14024 租户空间使用率超过阈值告警解释系统每小时周期性检测租户所关联的每个目录的空间使用率（每个目录已使用的空间大小/每个目录分配的空间大小），并把每个目录实际的空间使用率和该目录设置的阈值相比较。当检测到租户所关联的目录空间使用率高于该目录设置的阈值时，产生该告警。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12017 磁盘容量不足 - MapReduce服务 MRS

ALM-12017 磁盘容量不足告警解释系统每30秒周期性检测磁盘使用率，并把磁盘使用率和阈值相比较。磁盘使用率有一个默认阈值，当检测到磁盘使用率超过阈值时产生该告警。平滑次数为1，主机磁盘某一分区使用率小于或等于阈值时，告警恢复；平滑次数大于1，主机磁盘某一分区使用率小于或等于阈值的90%时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12018 内存使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-12018 内存使用率超过阈值（2.x及以前版本）告警解释系统每30秒周期性检测内存使用率，并把实际内存使用率和阈值相比较。内存使用率默认提供一个阈值。当检测到内存使用率超过阈值时产生该告警。当主机内存使用率小于或等于阈值的90%时，告警恢复。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12014 设备分区丢失（2.x及以前版本） - MapReduce服务 MRS

ALM-12014 设备分区丢失（2.x及以前版本）告警解释系统周期性进行扫描，如果检测到挂载服务目录的设备分区丢失（如由于设备拔出、设备离线、删除分区等原因）时，产生此告警。告警属性告警ID 告警级别可自动清除 12014 严重是：MRS 1.9.3.10及之后补丁版本

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Hue界面无法加载HBase表 - MapReduce服务 MRS

Hue界面无法加载HBase表用户问题用户在Hue界面将hive数据导入hbase后，报检测不到hbase表的错误。问题现象 Kerberos集群中，IAM子账户权限不足导致无法加载hbase表。原因分析 IAM子账户权限不足。处理步骤 MRS Manager界面操作：

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hue
ALM-12014 设备分区丢失 - MapReduce服务 MRS

ALM-12014 设备分区丢失告警解释系统按60秒周期进行扫描，如果检测到挂载服务目录的设备分区丢失（如由于设备拔出、设备离线、删除分区等原因）时，产生此告警。告警属性告警ID 告警级别是否自动清除 12014 重要是：MRS 3.3.0及之后版本、MRS 3.1.0

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
通过API提交Spark作业后作业状态为error - MapReduce服务 MRS

API V1.1接口作业提交后，状态显示为error。原因分析 executor会监控作业日志回显，确定作业执行结果，改为error后，检测不到输出结果，因此过期后判断作业状态为异常。处理步骤将“/opt/client/Spark/spark/conf/log4j.prop

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
ALM-44004 Presto Coordinator资源组排队任务超过阈值 - MapReduce服务 MRS

Presto Coordinator资源组排队任务超过阈值告警解释系统通过jmx接口查询资源组的排队任务数即QueuedQueries指标，当检测到资源组排队数大于阈值时产生该告警。用户可通过"组件管理 > Presto > 服务配置（将“基础配置”切换为“全部配置”） >Presto

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-16048 Tez或者Spark库路径不存在 - MapReduce服务 MRS

ALM-16048 Tez或者Spark库路径不存在告警解释系统每180秒周期性检测Tez和Spark库路径，不存在则产生该告警。告警属性告警ID 告警级别是否自动清除 16048 重要是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12006 节点故障 - MapReduce服务 MRS

omFloatIp : XXX.XXX.XXX.XXX is reachable. 是，执行12。否，执行9。查看检测完wsNetExport后是否打印omNetExport的检测日志或两条日志打印间隔时间超过10s或更长。是，执行10。否，执行12。查看操作系统的“/var/lo

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-44004 Presto Coordinator资源组排队任务超过阈值（2.x及以前版本） - MapReduce服务 MRS

Coordinator资源组排队任务超过阈值（2.x及以前版本）告警解释系统通过jmx接口查询资源组的排队任务数即QueuedQueries指标，当检测到资源组排队数大于阈值时产生该告警。用户可通过"组件管理 > Presto > 服务配置（将“基础配置”切换为“全部配置”） >Presto

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38017 分区均衡时间超过阈值 - MapReduce服务 MRS

分区均衡时间超过阈值告警解释系统每10分钟（可以通过修改Kafka配置项“auto.reassign.check.interval.ms”调整）周期性检测，扩容新的Broker后触发的分区均衡时间超过阈值（默认为1440分钟，可以通过修改Kafka配置项“reassignment.total

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45593 IoTDBServer Flush执行时长超过阈值 - MapReduce服务 MRS

ALM-45593 IoTDBServer Flush执行时长超过阈值告警解释当检测到数据Flush功能时长超出阈值时产生该告警。当Flush时长低于阈值时，告警清除。告警属性告警ID 告警级别是否自动清除 45593 重要是告警参数参数名称参数含义来源产生告警的集群名称。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 616

上一页
1
...
16
17
18
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-16001 Hive数据仓库空间使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-12012 NTP服务异常 - MapReduce服务 MRS

ALM-38011 Broker上用户连接数使用率超过设定阈值 - MapReduce服务 MRS

ALM-45337 Presto Worker3进程垃圾收集时间超出阈值 - MapReduce服务 MRS

ALM-19008 HBase服务进程堆内存使用率超出阈值 - MapReduce服务 MRS

ALM-12016 CPU使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-13001 ZooKeeper可用连接数不足（2.x及以前版本） - MapReduce服务 MRS

ALM-14024 租户空间使用率超过阈值 - MapReduce服务 MRS

ALM-12017 磁盘容量不足 - MapReduce服务 MRS

ALM-12018 内存使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-12014 设备分区丢失（2.x及以前版本） - MapReduce服务 MRS

Hue界面无法加载HBase表 - MapReduce服务 MRS

ALM-12014 设备分区丢失 - MapReduce服务 MRS

通过API提交Spark作业后作业状态为error - MapReduce服务 MRS

ALM-44004 Presto Coordinator资源组排队任务超过阈值 - MapReduce服务 MRS

ALM-16048 Tez或者Spark库路径不存在 - MapReduce服务 MRS

ALM-12006 节点故障 - MapReduce服务 MRS

ALM-44004 Presto Coordinator资源组排队任务超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-38017 分区均衡时间超过阈值 - MapReduce服务 MRS

ALM-45593 IoTDBServer Flush执行时长超过阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线