搜索_华为云

ALM-19006 HBase容灾同步失败（2.x及以前版本） - MapReduce服务 MRS

参数名称参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。对系统的影响无法同步集群中HBase的数据到备集群，导致主备集群数据不一致。可能原因备集群HBase服务异常。网络异常。处理步骤观察告警是否自动修复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12037 NTP服务器异常 - MapReduce服务 MRS

参数含义来源产生告警的集群或系统名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名异常NTP服务器的IP地址。对系统的影响主OMS节点配置的NTP服务器异常，可能会导致主OMS节点与外部服务器不能同步时间，集群时间可能会产生误差。时差超过5分钟以上

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-13001 ZooKeeper可用连接数不足 - MapReduce服务 MRS

角色名产生告警的角色名称。主机名产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 ZooKeeper可用连接数不足，当连接率超过100%时无法处理外部连接，导致上游组件（例如Yarn、Flink等）无法正常运行。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14014 NameNode进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

角色名产生告警的角色名称。主机名产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 NameNode进程的垃圾回收时间过长，可能影响该NameNode进程正常提供服务，用户无法读写文件。可能原因该节点Name

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18020 Yarn任务执行超时 - MapReduce服务 MRS

角色名产生告警的角色名称。应用名产生告警的应用名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响任务执行超时后的运行时间内，该告警一直存在，但任务仍继续正常执行，没有任何影响。可能原因指定的超时时间少于所需执行时间。任务运行的队列资源不足。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43006 JobHistory2x进程堆内存使用超出阈值 - MapReduce服务 MRS

角色名产生告警的角色名称。主机名产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 JobHistory2x进程堆内存使用率过高，会影响JobHistory2x进程运行的性能，甚至造成内存溢出导致JobHisto

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43020 IndexServer2x进程非堆内存使用超出阈值 - MapReduce服务 MRS

角色名产生告警的角色名称。主机名产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 IndexServer2x进程非堆内存使用率过高，会影响IndexServer2x进程运行的性能，甚至造成内存溢出导致Index

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark 应用场景在MRS服务中可以配合Jupyter Notebook使用PySpark，能够提高机器学习、数据探索和ETL应用开发效率。本实践指导用户如何在MRS集群中配置Jupyter Notebook来使用Pyspark。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
Kafka客户端使用实践 - MapReduce服务 MRS

种方式，区别如下： “--zookeeper”方式由客户端生成副本分配方案，社区从一开始就支持这种方式，为了降低对Zookeeper组件的依赖，社区将在后续版本中删除对这种方式的支持。基于这种方式创建Topic时，可以通过 "--enable-rack-aware" 和 “--e

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka
配置Guardian服务对接OBS - MapReduce服务 MRS

oop等组件。如果安装Hadoop、HetuEngine、Hive、Spark等组件后，再安装Guardian，则需要重新下载客户端，并对管理面作业提交的默认客户端进行刷新。如果当前集群未启用Kerberos认证，访问OBS的用户，需要属于supergroup组。可登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过Guardian对接OBS
使用Flume服务端从本地采集静态日志保存到Kafka - MapReduce服务 MRS

参数值填写规则参数样例名称不能为空，必须唯一 test spoolDir 待采集的文件所在的目录路径，此参数不能为空。该路径需存在，且对flume运行用户有读写执行权限。 /srv/BigData/hadoop/data1/zb trackerDir flume采集文件信息元数据保存路径。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume非加密传输数据采集任务
HDFS HA方案介绍 - MapReduce服务 MRS

为保证故障转移快速进行，Standby需要时刻保持最新的块信息，为此DataNodes同时向两个NameNodes发送块信息和心跳。对一个HA集群，保证任何时刻只有一个NameNode是Active状态至关重要。否则，命名空间会分为两部分，有数据丢失和产生其他错误的风险。为

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
使用Flume服务端从本地采集静态日志保存到Kafka - MapReduce服务 MRS

参数值填写规则参数样例名称不能为空，必须唯一 test spoolDir 待采集的文件所在的目录路径，此参数不能为空。该路径需存在，且对flume运行用户有读写执行权限。 /srv/BigData/hadoop/data1/zb trackerDir flume采集文件信息元数据保存路径。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > 配置Flume非加密传输数据采集任务
补丁安装后操作 - MapReduce服务 MRS

安装的补丁号为准。例如： cd /opt/Bigdata/patches/MRS_3.1.0.0.16/client/ 安全集群需要认证对HDFS有权限的用户，普通集群无需执行： kinit {用户} 执行以下命令升级HDFS上的zip包： sh update_hdfs_file

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.1.0.0.16补丁说明
隔离MRS集群节点 - MapReduce服务 MRS

除指定节点不安装补丁。隔离主机仅支持隔离非管理节点。该任务指导用户在MRS上根据实际业务或运维规划手工将主机隔离。隔离MRS集群节点对系统的影响主机隔离后该主机上的所有角色实例将被停止，且不能对主机及主机上的所有实例进行启动、停止和配置等操作。主机隔离后无法统计并显示该

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群节点
ALM-38018 Kafka消息积压 - MapReduce服务 MRS

产生告警的Kafka消费者组名称。附加信息 topic名称产生告警的Kafka Topic名称。消息积压量产生告警的Kafka Topic消息积压量。对系统的影响 Kafka Topic中消息保留时间有限（默认7天），若不及时消费Topic中积压的消息，则会导致数据丢失。可能原因新创建的

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14002 DataNode磁盘空间使用率超过阈值 - MapReduce服务 MRS

角色名产生告警的角色名称。主机名产生告警的主机名。 Trigger condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 DataNode容量不足，会影响到HDFS的数据写入。可能原因集群磁盘容量已满。 DataNode节点间数据倾斜。处理步骤

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-18003 NodeManager不健康 - MapReduce服务 MRS

服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。 Unhealthy Host 不健康节点的主机列表。对系统的影响故障的NodeManager节点无法提供Yarn服务。容器减少，集群性能下降。可能原因 NodeManager节点所在主机的硬盘空间不足。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19030 RegionServer的RPC请求处理时间的P99超过阈值 - MapReduce服务 MRS

产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。附加信息 Threshold 产生告警的阈值。对系统的影响 RegionServer RPC处理时间的P99超过阈值，会影响RegionServer对外提供服务的能力。对于时延敏感型业务，可能会导致大量的业务读写请求超时。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置HDFS DataNode数据均衡 - MapReduce服务 MRS

eration的时间），并用总数据量除以10GB估算任务执行时间。由于按iteration处理，Balancer可以随时启动或者停止。对系统的影响执行Balance操作时会占用DataNode的网络带宽资源，请根据业务需求在维护期间执行任务。默认使用带宽控制为20MB/s

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS

总条数： 3355

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-19006 HBase容灾同步失败（2.x及以前版本） - MapReduce服务 MRS

ALM-12037 NTP服务器异常 - MapReduce服务 MRS

ALM-13001 ZooKeeper可用连接数不足 - MapReduce服务 MRS

ALM-14014 NameNode进程垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-18020 Yarn任务执行超时 - MapReduce服务 MRS

ALM-43006 JobHistory2x进程堆内存使用超出阈值 - MapReduce服务 MRS

ALM-43020 IndexServer2x进程非堆内存使用超出阈值 - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

Kafka客户端使用实践 - MapReduce服务 MRS

配置Guardian服务对接OBS - MapReduce服务 MRS

使用Flume服务端从本地采集静态日志保存到Kafka - MapReduce服务 MRS

HDFS HA方案介绍 - MapReduce服务 MRS

使用Flume服务端从本地采集静态日志保存到Kafka - MapReduce服务 MRS

补丁安装后操作 - MapReduce服务 MRS

隔离MRS集群节点 - MapReduce服务 MRS

ALM-38018 Kafka消息积压 - MapReduce服务 MRS

ALM-14002 DataNode磁盘空间使用率超过阈值 - MapReduce服务 MRS

ALM-18003 NodeManager不健康 - MapReduce服务 MRS

ALM-19030 RegionServer的RPC请求处理时间的P99超过阈值 - MapReduce服务 MRS

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线