搜索_华为云

查看ClickHouse慢查询语句 - MapReduce服务 MRS

where条件以及索引等设置不合理问题，导致SQL查询很慢，影响数据库的整体性能。针对该场景，MRS提供了ClickHouse慢查询语句的监控功能。正在进行的慢查询当前还在执行没有返回结果的慢SQL语句信息可以通过该界面查询。慢查询菜单路径 MRS 3.2.0之前版本：登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse企业级能力增强
集群运维 - MapReduce服务 MRS
集群运维 - MapReduce服务 MRS

告警管理 MRS可以实时监控大数据集群，通过告警和事件可以识别系统健康状态。同时MRS也支持用户自定义配置监控与告警阈值用于关注各指标的健康情况，当监控数据达到告警阈值，系统将会触发一条告警信息。 MRS还可以与华为云消息通知服务(SMN)的消息服务系统对接，将告警信息通过短信或

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
配置MRS集群阈值类告警 - MapReduce服务 MRS

MRS集群提供可视化、便捷的监控告警功能。用户可以快速获取集群关键性能指标，并评测集群健康状态。MRS支持配置监控指标阈值用于关注各指标的健康情况，如果出现异常的数据并满足预设条件后，系统将会触发告警信息，并在告警页面中出现此告警信息。如果部分阈值类监控告警经评估后对业务影响可忽

 帮助中心 > MapReduce服务 MRS > 最佳实践 > MRS集群管理
MRS集群Manager简介 - MapReduce服务 MRS

如果服务右侧显示则表示该服务配置已过期。监控状态报表：主页界面的右侧为图表区，包含关键监控状态的报表，例如集群中所有主机的状态、主机CPU使用率、主机内存使用率等。用户可以自定义在图表区展示的监控报表，请参考查看MRS集群资源监控指标。监控图表的数据来源可在图表的左下方查看，每个监控报表可以放大查看具体数值，也可以关闭不再显示。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群
使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

23456 登录后可以查看Kafka集群监控页面、Topic监控页面、Consumer监控页面，例如：图2 Kafka集群监控图3 Topic监控图4 Consumer监控常见问题问题现象：无法获取Kafka CPU与内存监控信息日志提示。 java.io.IOException

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
ALM-24001 Flume Agent异常 - MapReduce服务 MRS

指定服务器上用户自定义已经存在的数据监控目录。查看Flume Agent运行用户对步骤13所指定的监控目录是否有可读可写可执行权限。是，执行17。否，执行16。使用Flume运行用户进入监控目录，若可以创建文件，这说明Flume运行用户是否对该监控目录具有可读可写可执行权限。执行“chmod

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19011 RegionServer的Region数量超出阈值 - MapReduce服务 MRS

RegionServer的Region数量超出阈值告警解释系统每30秒周期性检测每个HBase服务实例中每个RegionServer的Region数。该指标可以在HBase服务监控界面和RegionServer角色监控界面查看，当检测到某个RegionServer上的Regio

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
OpenTSDB应用开发简介 - MapReduce服务 MRS

nTSDB的设计目标是用来采集大规模集群中的监控类信息，并可实现数据的秒级查询，解决海量监控类数据在普通数据库中查询存储的局限性。 OpenTSDB使用场景有如下几个特点：采集指标在某一时间点具有唯一值，没有复杂的结构及关系。监控的指标具有随着时间不断变化的特点。具有HBase的高吞吐，良好的伸缩性等特点。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > OpenTSDB开发指南 > OpenTSDB应用开发概述
ALM-24001 Flume Agent异常（2.x及以前版本） - MapReduce服务 MRS

ALM-24001 Flume Agent异常（2.x及以前版本）告警解释 Flume Agent监控模块对Flume Agent状态进行监控，当Flume Agent进程故障时，系统产生此告警。当检测到Flume Agent进程故障恢复，且告警处理完成时，告警恢复。告警属性告警ID

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12005 OKerberos资源异常 - MapReduce服务 MRS

80秒周期进行监控，当连续6次监控到Kerberos资源异常时，系统产生此告警。当Kerberos资源恢复时，且告警处理完成时，告警恢复。告警属性告警ID 告警级别是否自动清除 12005 重要是告警参数参数名称参数含义来源产生告警的集群或系统名称。服务名产生告警的服务名称。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12172 指标上报CES失败 - MapReduce服务 MRS

是告警参数参数名称参数含义来源产生告警的集群或者系统名称服务名产生告警的服务名称角色名产生告警的角色名称主机名产生告警的主机名对系统的影响监控指标上报CES失败，在CES中无法看到MRS云服务的监控指标。可能原因权限问题请求CES接口失败。网络问题上报CES数据失败。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
查看MRS集群静态资源 - MapReduce服务 MRS

有运行在Yarn上的服务资源进行管理和隔离。系统支持基于时间的静态服务资源池自动调整策略，使集群在不同的时间段自动调整参数值，从而更有效地利用资源。系统管理员可以在Manager查看静态服务池各个服务使用资源的监控指标结果，包含监控指标如下：服务总体CPU使用率服务总体磁盘IO读速率

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群静态服务资源
Manager关键特性 - MapReduce服务 MRS

Manager关键特性：统一用户权限管理 Manager提供系统中各组件的权限集中管理功能。 Manager引入角色的概念，采用RBAC的方式对系统进行权限管理，集中呈现和管理系统中各组件零散的权限功能，并且将各个组件的权限以权限集合（即角色）的形式组织，形成统一的系统权限概念。这样一方面对普通用户屏蔽了

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Manager
HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

HBase日志文件过大导致OS盘空间不足用户问题 OS盘/var/log分区空间不足。问题现象 “/var/log/Bigdata/hbase/*/hbase-omm-*.out”日志文件过大，造成OS盘/var/log分区空间不足。原因分析在HBase长时间运行场景下，操作系统会把JVM创建的“/tmp/

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ALM-14020 HDFS目录条目数量超过阈值 - MapReduce服务 MRS

Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响当监控目录下的条目数超过系统阈值的90%触发该告警，但不影响对该目录继续增加条目。一旦超过系统最大阈值，继续增加条目会失败。可能原因监控目录的条目数超过系统阈值的90%。处理步骤检查系统中是否有不需要的文件。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
有210000个map和10000个reduce的HBase BulkLoad任务运行失败 - MapReduce服务 MRS

0个map和10000个reduce，任务失败。回答 ZooKeeper IO瓶颈观测手段：通过Manager的监控页面查看单个节点上ZooKeeper请求监控，判断是否严重超出规格限制。通过观测ZooKeeper的日志以及HBase的日志，查看是否有大量的IO Exception

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase故障排除
Flink应用性能调优建议 - MapReduce服务 MRS

Flink是依赖内存计算，计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存使用及剩余情况来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的YARN的Container GC日志，如果频繁出现Full GC，需要优化GC。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

HDFS日志文件过大导致OS盘空间不足用户问题 OS盘/var/log分区空间不足。问题现象 “/var/log/Bigdata/hdfs/*/hdfs-omm-*.out”日志文件过大，造成OS盘/var/log分区空间不足。原因分析在HDFS长时间运行场景下，操作系统会把JVM创建的“/tmp/

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ALM-45646 RocksDB的Pending Compaction持续超过阈值 - MapReduce服务 MRS

本章节适用于MRS 3.3.0及以后版本。告警解释系统以用户配置的告警周期（metrics.reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Pending Co

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark on OBS性能调优 - MapReduce服务 MRS

DefaultMetricsConsumer：表示不收集OBS监控指标要使用OBS监控功能，需确保上报OBS监控指标开关打开。 org.apache.hadoop.fs.obs.metrics.OBSAMetricsProvider 父主题：使用Spark/Spark2x

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x

总条数： 2406

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看ClickHouse慢查询语句 - MapReduce服务 MRS

集群运维 - MapReduce服务 MRS

配置MRS集群阈值类告警 - MapReduce服务 MRS

MRS集群Manager简介 - MapReduce服务 MRS

使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

ALM-24001 Flume Agent异常 - MapReduce服务 MRS

ALM-19011 RegionServer的Region数量超出阈值 - MapReduce服务 MRS

OpenTSDB应用开发简介 - MapReduce服务 MRS

ALM-24001 Flume Agent异常（2.x及以前版本） - MapReduce服务 MRS

ALM-12005 OKerberos资源异常 - MapReduce服务 MRS

ALM-12172 指标上报CES失败 - MapReduce服务 MRS

查看MRS集群静态资源 - MapReduce服务 MRS

Manager关键特性 - MapReduce服务 MRS

HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

ALM-14020 HDFS目录条目数量超过阈值 - MapReduce服务 MRS

有210000个map和10000个reduce的HBase BulkLoad任务运行失败 - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

ALM-45646 RocksDB的Pending Compaction持续超过阈值 - MapReduce服务 MRS

Spark on OBS性能调优 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线