搜索_华为云

ALM-50210 所有BE节点中最大的compaction score值超过阈值 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响可能导致查询或写入延迟。可能原因集群业务并发量较大或compaction队列设置较小。处理步骤检查告警阈值配置或者平滑次数配置是否合理。登录FusionInsight Manager，选择“运维 > 告警 > 阈值设置 > 待操作集群的名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43009 JobHistory GC 时间超出阈值（2.x及以前版本） - MapReduce服务 MRS

际情况调大。观察界面告警是否清除。是，处理完毕。否，执行2。收集故障信息。在MRS Manager界面，单击“系统设置 > 日志导出”。请联系运维人员，并发送已收集的故障日志信息。参考信息无。父主题： MRS集群告警处理参考

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-24013 Flume MonitorServer证书文件非法或已损坏 - MapReduce服务 MRS

MonitorServer证书文件已经非法或损坏，功能受限，Flume客户端将无法访问Flume服务端。可能原因 MonitorServer证书文件非法或损坏。处理步骤查看告警信息。登录FusionInsight Manager首页，选择“运维 > 告警 > 告警 > ALM-24013 MonitorServer证书文件非法或已损坏

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43007 JobHistory2x进程非堆内存使用超出阈值 - MapReduce服务 MRS

进程不可用时仅会造成无法查询Spark任务历史执行记录。可能原因该节点JobHistory2x进程非堆内存使用率过大，或配置的非堆内存不合理，导致使用率超过阈值。处理步骤检查非堆内存使用率在FusionInsight Manager首页，选择“运维 > 告警 > 告警”，选中“ID”为“43007”

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45586 IoTDBServer堆内存使用率超过阈值 - MapReduce服务 MRS

“-Xmx”的值默认2G。如果该告警偶然发生，参数值按照0.5倍速率调大。如果该告警频繁发生，参数值按照1倍速率调大。多业务量、高并发的情况可以考虑扩容实例。观察界面告警是否清除。是，处理完毕。否，执行5。收集故障信息。在FusionInsight Manager界面，选择“运维 > 日志

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

参考ALM-45646 RocksDB的Pending Compaction持续超过阈值章节处理对应的告警。 ALM-45646告警全部恢复后，等待几分钟，检查本告警是否恢复。是，处理完毕。否，执行5。检查是否RocksDB的Compaction压力过大并伴随ALM-45647告警

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45745 Guardian TokenServer RPC队列平均时间超过阈值 - MapReduce服务 MRS

是，执行7。否，执行9。按照“ALM-45737 TokenServer堆内存使用率超过阈值”的处理步骤处理该故障。等待10分钟，查看该告警是否自动消除。是，处理完毕。否，执行9。收集故障信息。在FusionInsight Manager界面，选择“运维 > 日志

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12001 审计日志转储失败（2.x及以前版本） - MapReduce服务 MRS

等待2分钟，查看告警列表中，该告警是否已清除。是，处理完毕。否，执行2 重新设置转储规则。在MRS Manager界面，单击“系统设置 > 审计日志转储配置”。重新设置转储规则，填入正确的参数，单击“确定”。 2分钟后，查看告警列表中，该告警是否已清除。是，处理完毕。否，执行3 收集故障信息。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12015 设备分区文件系统只读（2.x及以前版本） - MapReduce服务 MRS

拔出磁盘后系统会上报“ALM-12014 分区丢失”告警，参考ALM-12014 设备分区丢失（2.x及以前版本）进行处理，处理完成后，本告警即可自动消除。参考信息无。父主题： MRS集群告警处理参考

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12035 恢复失败后数据状态未知（2.x及以前版本） - MapReduce服务 MRS

该告警产生原因可能是执行恢复任务前组件状态不满足要求或执行恢复任务中某个步骤出错，执行恢复任务中出错依赖于该任务的详细情况，可以获取日志和任务详情来处理该告警。处理步骤查看组件状态在MRS Manager管理界面，选择“服务管理”，查看组件当前的运行状态是否满足要求（OMS、DBServic

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14009 故障DataNode数量超过阈值（2.x及以前版本） - MapReduce服务 MRS

HDFS DataNode内存使用率超过阈值（2.x及以前版本）的处理步骤，对该异常告警进行处理，查看是否消除该告警。是，执行3.c。否，执行4.a。等待5分钟后，在告警列表中查看本告警是否恢复。是，处理完毕。否，执行4.a。查看NameNode是否负荷过高。在MR

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18011 Yarn任务挂起内存超过阈值（2.x及以前版本） - MapReduce服务 MRS

Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响可能导致任务堆积，无法及时处理。可能原因集群运算能力低于任务提交速率，导致任务提交后无法及时运行处理。处理步骤检查Yarn页面的内存和vcore使用情况。查看Yarn原生页面的Memory Used|Memory

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-23001 Loader服务不可用（2.x及以前版本） - MapReduce服务 MRS

是，执行1.f。否，执行2.a。参考ALM-12007 进程故障（2.x及以前版本）的处理步骤处理该故障。在告警列表中，查看“ALM-23001 Loader服务不可用”告警是否清除。是，处理完毕。否，执行2.a。检查HDFS服务状态。登录MRS集群详情页面，选择“告警管理”。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
executor内存不足导致查询性能下降 - MapReduce服务 MRS

executor内存不足导致查询性能下降现象描述在不同的查询周期内运行查询功能，查询性能会有起伏。可能原因在处理数据加载时，为每个executor程序实例配置的内存不足，可能会产生更多的Java GC（垃圾收集）。当GC发生时，会发现查询性能下降。定位思路在Spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData故障处理
快速开发Spark应用 - MapReduce服务 MRS

快速开发Spark应用 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言的应用开发。通常适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
ALM-45282 UserSync直接内存使用率超过阈值 - MapReduce服务 MRS

对系统的影响直接内存溢出可能导致服务崩溃。可能原因节点UserSync实例直接内存使用率过大，或配置的直接内存不合理，导致使用率超过阈值。处理步骤检查直接内存使用率。在FusionInsight Manager首页，选择“运维 > 告警 > 告警 > ALM-45282 Us

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45738 TokenServer直接内存使用率超过阈值 - MapReduce服务 MRS

能导致业务无法正常访问OBS。可能原因节点TokenServer实例直接内存使用率过大，或配置的直接内存不合理，导致使用率超过阈值。处理步骤检查直接内存使用率。在FusionInsight Manager首页，选择“运维 > 告警 > 告警 > ALM-45738 To

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-50406 JobServer提交作业接口失败率超过阈值 - MapReduce服务 MRS

产生告警的主机名对系统的影响用户执行提交作业失败。例如：通过REST接口提交作业可能失败。可能原因该节点JobServer实例存在异常。处理步骤在FusionInsight Manager首页，选择“运维 > 告警 > 告警 > JobServer提交作业接口失败率 > 定位

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-50408 JobServer终止作业接口失败率超过阈值 - MapReduce服务 MRS

产生告警的主机名对系统的影响用户执行终止作业失败。例如：通过REST接口终止作业可能失败。可能原因该节点JobServer实例存在异常。处理步骤在FusionInsight Manager首页，选择“运维 > 告警 > 告警 > JobServer提交作业接口失败率 > 定位

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12049 网络读吞吐率超过阈值（2.x及以前版本） - MapReduce服务 MRS

提升网口速率。检查该告警是否恢复。是，处理完毕。否，执行9 收集故障信息。在MRS Manager界面，单击“系统设置 > 日志导出”。请联系运维人员，并发送已收集的故障日志信息。参考信息无。父主题： MRS集群告警处理参考

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 2504

上一页
1
...
51
52
53
...
126
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-50210 所有BE节点中最大的compaction score值超过阈值 - MapReduce服务 MRS

ALM-43009 JobHistory GC 时间超出阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-24013 Flume MonitorServer证书文件非法或已损坏 - MapReduce服务 MRS

ALM-43007 JobHistory2x进程非堆内存使用超出阈值 - MapReduce服务 MRS

ALM-45586 IoTDBServer堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

ALM-45745 Guardian TokenServer RPC队列平均时间超过阈值 - MapReduce服务 MRS

ALM-12001 审计日志转储失败（2.x及以前版本） - MapReduce服务 MRS

ALM-12015 设备分区文件系统只读（2.x及以前版本） - MapReduce服务 MRS

ALM-12035 恢复失败后数据状态未知（2.x及以前版本） - MapReduce服务 MRS

ALM-14009 故障DataNode数量超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-18011 Yarn任务挂起内存超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-23001 Loader服务不可用（2.x及以前版本） - MapReduce服务 MRS

executor内存不足导致查询性能下降 - MapReduce服务 MRS

快速开发Spark应用 - MapReduce服务 MRS

ALM-45282 UserSync直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-45738 TokenServer直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-50406 JobServer提交作业接口失败率超过阈值 - MapReduce服务 MRS

ALM-50408 JobServer终止作业接口失败率超过阈值 - MapReduce服务 MRS

ALM-12049 网络读吞吐率超过阈值（2.x及以前版本） - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线