搜索_华为云

MRS集群Manager简介 - MapReduce服务 MRS

如果服务右侧显示则表示该服务配置已过期。监控状态报表：主页界面的右侧为图表区，包含关键监控状态的报表，例如集群中所有主机的状态、主机CPU使用率、主机内存使用率等。用户可以自定义在图表区展示的监控报表，请参考查看MRS集群资源监控指标。监控图表的数据来源可在图表的左下方查看，每个监控报表可以放大查看具体数值，也可以关闭不再显示。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群
查看ClickHouse复制表数据同步监控 - MapReduce服务 MRS

查看ClickHouse复制表数据同步监控操作场景 Replicated*MergeTree系列引擎表同分片下的多个副本数据相互进行同步，MRS针对该场景下的表数据同步进行了状态监控。约束限制当前只支持Replicated*MergeTree系列引擎表并且建表语句携带ON CLUSTER关键字的表监控查询。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse企业级能力增强
Kafka Topic监控页签在Manager页面不显示如何处理？ - MapReduce服务 MRS

Kafka Topic监控页签在Manager页面不显示如何处理？问： Kafka Topic监控页签在Manager页面不显示怎么办？答：分别登录集群Master节点，并切换用户为omm。进入目录“/opt/Bigdata/apache-tomcat-7.0.78/we

帮助中心 > MapReduce服务 MRS > 常见问题 > Web页面访问类
集群运维 - MapReduce服务 MRS
集群运维 - MapReduce服务 MRS

告警管理 MRS可以实时监控大数据集群，通过告警和事件可以识别系统健康状态。同时MRS也支持用户自定义配置监控与告警阈值用于关注各指标的健康情况，当监控数据达到告警阈值，系统将会触发一条告警信息。 MRS还可以与华为云消息通知服务(SMN)的消息服务系统对接，将告警信息通过短信或

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
MRS集群阈值类告警配置说明 - MapReduce服务 MRS

MRS集群提供可视化、便捷的监控告警功能。用户可以快速获取集群关键性能指标，并评测集群健康状态。 MRS支持配置监控指标阈值用于关注各指标的健康情况，如果出现异常的数据并满足预设条件后，系统将会触发告警信息，并在告警页面中出现此告警信息。如果部分阈值类监控告警经评估后对业务影响可忽

 帮助中心 > MapReduce服务 MRS > 最佳实践 > MRS集群管理
ALM-24001 Flume Agent异常 - MapReduce服务 MRS

指定服务器上用户自定义已经存在的数据监控目录。查看Flume Agent运行用户对步骤13所指定的监控目录是否有可读可写可执行权限。是，执行17。否，执行16。使用Flume运行用户进入监控目录，若可以创建文件，这说明Flume运行用户是否对该监控目录具有可读可写可执行权限。执行“chmod

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19011 RegionServer的Region数量超出阈值 - MapReduce服务 MRS

RegionServer的Region数量超出阈值告警解释系统每30秒周期性检测每个HBase服务实例中每个RegionServer的Region数。该指标可以在HBase服务监控界面和RegionServer角色监控界面查看，当检测到某个RegionServer上的Regio

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Flink对接应用运维管理（AOM） - MapReduce服务 MRS

事件全景数据监控，提供一体化监控能力。Flink可以通过AOM服务的Prometheus实例将监控指标推送至AOM服务，用户可以方便查看监控指标相关信息。本示例提供通过FlinkResource、FlinkServer和客户端三种方式对接AOM服务，将Flink监控指标上传至AOM服务。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink运维管理
ALM-24001 Flume Agent异常（2.x及以前版本） - MapReduce服务 MRS

ALM-24001 Flume Agent异常（2.x及以前版本）告警解释 Flume Agent监控模块对Flume Agent状态进行监控，当Flume Agent进程故障时，系统产生此告警。当检测到Flume Agent进程故障恢复，且告警处理完成时，告警恢复。告警属性告警ID

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

登录后可以查看Kafka集群监控页面、Topic监控页面、Consumer监控页面，例如：图3 Kafka集群监控图4 Topic监控图5 Consumer监控 Kafka Eagle对接常见问题问题现象：无法获取Kafka CPU与内存监控信息日志提示。 java.io

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
ALM-12005 OKerberos资源异常 - MapReduce服务 MRS

ALM-12005 OKerberos资源异常告警解释告警模块对Manager中的Kerberos资源的状态按80秒周期进行监控，当连续6次监控到Kerberos资源异常时，系统产生此告警。当Kerberos资源恢复时，且告警处理完成时，告警恢复。 MRS 3.3.1及之后版本，告警名称从

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HDFS文件系统目录简介 - MapReduce服务 MRS

HDFS文件系统目录简介 HDFS是Hadoop的分布式文件系统（Hadoop Distributed File System），实现大规模数据可靠的分布式读写。HDFS针对的使用场景是数据读写具有“一次写，多次读”的特征，而数据“写”操作是顺序写，也就是在文件创建时的写入或者在

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
查看MRS集群静态资源 - MapReduce服务 MRS

有运行在Yarn上的服务资源进行管理和隔离。系统支持基于时间的静态服务资源池自动调整策略，使集群在不同的时间段自动调整参数值，从而更有效地利用资源。系统管理员可以在Manager查看静态服务池各个服务使用资源的监控指标结果，包含监控指标如下：服务总体CPU使用率服务总体磁盘IO读速率

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群静态服务资源
查看ClickHouse慢查询语句 - MapReduce服务 MRS

where条件以及索引等设置不合理问题，导致SQL查询很慢，影响数据库的整体性能。针对该场景，MRS提供了ClickHouse慢查询语句的监控功能。正在进行的慢查询当前还在执行没有返回结果的慢SQL语句信息可以通过该界面查询。慢查询菜单路径 MRS 3.2.0之前版本：登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse企业级能力增强
Manager关键特性 - MapReduce服务 MRS

Manager关键特性：统一用户权限管理 Manager提供系统中各组件的权限集中管理功能。 Manager引入角色的概念，采用RBAC的方式对系统进行权限管理，集中呈现和管理系统中各组件零散的权限功能，并且将各个组件的权限以权限集合（即角色）的形式组织，形成统一的系统权限概念。这样一方面对普通用户屏蔽了

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Manager
OpenTSDB应用开发简介 - MapReduce服务 MRS

nTSDB的设计目标是用来采集大规模集群中的监控类信息，并可实现数据的秒级查询，解决海量监控类数据在普通数据库中查询存储的局限性。 OpenTSDB使用场景有如下几个特点：采集指标在某一时间点具有唯一值，没有复杂的结构及关系。监控的指标具有随着时间不断变化的特点。具有HBase的高吞吐，良好的伸缩性等特点。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > OpenTSDB开发指南 > OpenTSDB应用开发概述
HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

HBase日志文件过大导致OS盘空间不足用户问题 OS盘/var/log分区空间不足。问题现象 “/var/log/Bigdata/hbase/*/hbase-omm-*.out”日志文件过大，造成OS盘/var/log分区空间不足。原因分析在HBase长时间运行场景下，操作系统会把JVM创建的“/tmp/

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ALM-45646 RocksDB的Pending Compaction持续超过阈值 - MapReduce服务 MRS

本章节适用于MRS 3.3.0及以后版本。告警解释系统以用户配置的告警周期（metrics.reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Pending Co

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14020 HDFS目录条目数量超过阈值 - MapReduce服务 MRS

Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响当监控目录下的条目数超过系统阈值的90%触发该告警，但不影响对该目录继续增加条目。一旦超过系统最大阈值，继续增加条目会失败。可能原因监控目录的条目数超过系统阈值的90%。处理步骤检查系统中是否有不需要的文件。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45643 RocksDB的MemTable大小持续超过阈值 - MapReduce服务 MRS

本章节适用于MRS 3.3.0及以后版本。告警解释系统以用户配置的告警周期（metrics.reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的MemTable大小持续超过用户配置的阈值（metrics

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 2508

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS集群Manager简介 - MapReduce服务 MRS

查看ClickHouse复制表数据同步监控 - MapReduce服务 MRS

Kafka Topic监控页签在Manager页面不显示如何处理？ - MapReduce服务 MRS

集群运维 - MapReduce服务 MRS

MRS集群阈值类告警配置说明 - MapReduce服务 MRS

ALM-24001 Flume Agent异常 - MapReduce服务 MRS

ALM-19011 RegionServer的Region数量超出阈值 - MapReduce服务 MRS

Flink对接应用运维管理（AOM） - MapReduce服务 MRS

ALM-24001 Flume Agent异常（2.x及以前版本） - MapReduce服务 MRS

使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

ALM-12005 OKerberos资源异常 - MapReduce服务 MRS

HDFS文件系统目录简介 - MapReduce服务 MRS

查看MRS集群静态资源 - MapReduce服务 MRS

查看ClickHouse慢查询语句 - MapReduce服务 MRS

Manager关键特性 - MapReduce服务 MRS

OpenTSDB应用开发简介 - MapReduce服务 MRS

HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

ALM-45646 RocksDB的Pending Compaction持续超过阈值 - MapReduce服务 MRS

ALM-14020 HDFS目录条目数量超过阈值 - MapReduce服务 MRS

ALM-45643 RocksDB的MemTable大小持续超过阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线