搜索_华为云

ALM-45587 IoTDBServer垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响 IoTDBServer进程的垃圾回收（GC）时间过长，可能影响该IoTDBServer进程无法正常提供数据读写服务。可能原因该节点IoTDBServer实例堆内存使用率过大，或配置的堆内存不合理，导致进程GC频繁。处理步骤检查GC时间。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-24006 Flume Server堆内存使用率超过阈值 - MapReduce服务 MRS

“确定”。出现此告警时，说明当前flume server设置的堆内存无法满足当前数据传输所需的堆内存，建议堆内存调整为： channel capacity * 最大单条数据大小*通道个数，但xmx参数值不能超过节点剩余内存。重启受影响的服务或实例，观察界面告警是否清除。是，处理完毕。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-24008 Flume Server非堆内存使用率超过阈值 - MapReduce服务 MRS

MaxPermSize”的值根据实际情况调大，并单击“保存”，单击“确定”。出现此告警时，说明当前flume server实例设置非堆内存大小无法满足当前业务使用场景，建议调整“-XX:MaxPermSize”的值为当前非堆内存使用量的两倍（或根据实际情况进行调整）。重启受影响的服务或实例观察界面告警是否清除。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark Streaming调优 - MapReduce服务 MRS

性能，但由于缺少WAL机制，会出现异常恢复时，数据丢失。因此，在调优Streaming的时候，这些保证数据可靠性的配置项，在生产环境中是不能关闭的。父主题： Spark应用调优

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优
ALM-24007 Flume Server直接内存使用率超过阈值 - MapReduce服务 MRS

morySize”的值根据实际情况调大，并单击“保存”，单击“确定”。出现此告警时，说明当前flume server实例设置直接内存大小无法满足当前业务使用场景，建议调整“-XX:MaxDirectMemorySize”的值为当前直接内存使用量的两倍（或根据实际情况进行调整）。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-24009 Flume Server垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

“确定”。出现此告警时，说明当前flume server设置的堆内存无法满足当前数据传输所需的堆内存，建议堆内存调整为： channel capacity * 最大单条数据大小*通道个数，但xmx参数值不能超过节点剩余内存。重启受影响的服务或实例，观察界面告警是否清除。是，处理完毕。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置流式读取Spark Driver执行结果 - MapReduce服务 MRS

thriftServer.useHdfsCollect参数设置为true时，将结果数据保存到HDFS中，但JobHistory原生页面上Job的描述信息无法正常关联到对应的SQL语句，同时spark-beeline命令行中回显的Execution ID为null，为解决JDBCServer O

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
Spark任务由于内存不够或提交作业时未添加Jar包，作业卡住 - MapReduce服务 MRS

如果对核数有要求，可以搜索并修改spark.driver.cores和spark.executor.cores的核数取值。 Spark依赖内存做计算，如果以上还是不能满足任务的提交需要，建议扩容集群。父主题：使用Spark

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
缩容集群 - MapReduce服务 MRS
缩容集群 - MapReduce服务 MRS

result String 参数解释：更新映射请求操作结果。约束限制：不涉及取值范围： succeeded：操作成功 failed：操作失败默认取值：不涉及请求示例在node_group_1节点组上缩容1个节点。 /v2/ff8080828997cb24018a1b2d

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
扩容集群 - MapReduce服务 MRS
扩容集群 - MapReduce服务 MRS

请求操作结果。非包周期节点组扩容请求下发成功时，会包含该字段且内容为success。约束限制：不涉及取值范围： succeeded：操作成功 failed为操作失败默认取值：不涉及 order_id String 参数解释：订单ID。对包周期节点组进行扩容时，会返回本次扩容产生的订单ID，需要客

 帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
实时数据加载：通过FlinkSQL将订单表Kafka数据实时同步到Doris - MapReduce服务 MRS

时间间隔(ms)：20000（默认最小时间间隔20s）模式：EXACTLY_ONCE，其他默认参数即可故障恢复策略：fixed-delay 重试次数：3 失败重试间隔(s)：60 其他配置保持默认即可配置作业完成后，可以单击上方“语义校验”对输入内容校验，单击“SQL格式化”对SQL语句进行格

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
ALM-45745 Guardian TokenServer RPC队列平均时间超过阈值 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响 Guardian TokenServer实例RPC队列平均时间超过阈值可能导致业务访问OBS变慢，严重时会导致无法正常访问OBS。可能原因告警阈值配置不合理。或Guardian TokenServer实例设置的内存太小，频繁Full GC造成JVM卡顿。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14009 故障DataNode数量超过阈值（2.x及以前版本） - MapReduce服务 MRS

产生告警的主机名。 Trigger condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响故障状态的DataNode节点无法提供HDFS服务。可能原因 DataNode故障或者负荷过高。 NameNode和DataNode之间的网络断连或者繁忙。 NameNode负荷过高。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
启用MRS集群间拷贝功能 - MapReduce服务 MRS

用之后即可创建将数据备份至远端HDFS（RemoteHDFS）的备份任务。对系统的影响启用集群间复制功能需要重启Yarn，服务重启期间无法访问。前提条件复制数据的集群的HDFS的参数“hadoop.rpc.protection”需使用相同的数据传输方式。默认设置为“pri

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据
ALM-45744 Guardian TokenServer RPC处理平均时间超过阈值 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响 Guardian TokenServer实例RPC处理平均时间超过阈值可能导致业务访问OBS变慢，严重时会导致无法正常访问OBS。可能原因告警阈值配置不合理。 Guardian TokenServer实例设置的内存太小，频繁Full GC造成JVM卡顿。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-25008 SlapdServer CPU使用率超过阈值 - MapReduce服务 MRS

引起Kerberos认证超时或操作系统用户缓存同步异常，进而导致组件业务故障。可能原因告警阈值配置或者平滑次数配置不合理。 CPU配置无法满足业务需求，CPU使用率达到上限。处理步骤检查告警阈值配置或者平滑次数配置是否合理。登录FusionInsight Manager，选择“运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
MRS集群节点规格说明 - MapReduce服务 MRS

当节点的实例规格选项后标示“已售罄”时，将无法购买此规格的节点，请选择其他规格节点进行购买。 Master节点中的4核8GB规格不在SLA售后范围内，仅适用于测试环境，不建议用于生产环境。 MRS 3.x及之后版本集群Master节点规格不能小于64GB。磁盘角色表1 MRS集群节点磁盘类型

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群规划 > 业务选型
开启MRS集群维护模式停止上报告警 - MapReduce服务 MRS

对OMS节点进行重启、替换、修复等操作时，可将OMS配置为维护模式。本章节仅适用于MRS 3.x及之后版本。对系统影响设置维护模式后，非维护操作引起的告警也将被抑制无法上报，直至退出维护模式后，仍然存在的故障才能上报告警，请谨慎操作。开启MRS集群维护模式登录FusionInsight Manager。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看与配置MRS告警事件
ALM-16001 Hive数据仓库空间使用率超过阈值 - MapReduce服务 MRS

产生告警的主机名。 Trigger condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 Hive数据仓库空间写满后系统将无法正常写入数据，可能导致部分数据丢失。可能原因 Hive使用HDFS容量上限过小。 HDFS空间不足。部分数据节点瘫痪。处理步骤扩展系统配置。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
DBService超过最大连接数后导致Hive MetaStore异常 - MapReduce服务 MRS

database.max.connections配置项，并修改dbservice.database.max.connections配置的值到合适值，不能超过1000。保存配置，并重启受影响的服务或者实例。如果调整完还报超过最大连接数，需要排查业务代码，是否有连接泄露。父主题：使用Hive

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive

总条数： 4242

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-45587 IoTDBServer垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-24006 Flume Server堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-24008 Flume Server非堆内存使用率超过阈值 - MapReduce服务 MRS

Spark Streaming调优 - MapReduce服务 MRS

ALM-24007 Flume Server直接内存使用率超过阈值 - MapReduce服务 MRS

ALM-24009 Flume Server垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

配置流式读取Spark Driver执行结果 - MapReduce服务 MRS

Spark任务由于内存不够或提交作业时未添加Jar包，作业卡住 - MapReduce服务 MRS

缩容集群 - MapReduce服务 MRS

扩容集群 - MapReduce服务 MRS

实时数据加载：通过FlinkSQL将订单表Kafka数据实时同步到Doris - MapReduce服务 MRS

ALM-45745 Guardian TokenServer RPC队列平均时间超过阈值 - MapReduce服务 MRS

ALM-14009 故障DataNode数量超过阈值（2.x及以前版本） - MapReduce服务 MRS

启用MRS集群间拷贝功能 - MapReduce服务 MRS

ALM-45744 Guardian TokenServer RPC处理平均时间超过阈值 - MapReduce服务 MRS

ALM-25008 SlapdServer CPU使用率超过阈值 - MapReduce服务 MRS

MRS集群节点规格说明 - MapReduce服务 MRS

开启MRS集群维护模式停止上报告警 - MapReduce服务 MRS

ALM-16001 Hive数据仓库空间使用率超过阈值 - MapReduce服务 MRS

DBService超过最大连接数后导致Hive MetaStore异常 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线