搜索_华为云

ALM-45650 RocksDB的Write P95耗时持续超过阈值 - MapReduce服务 MRS

告警解释系统以用户配置的告警周期（metrics.reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Write P95耗时达到用户配置的阈值（metrics.reporter.alarm.job.alarm.rocksdb.write.micros.threshold

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45647 RocksDB的Pending Compaction预估总大小持续超过阈值 - MapReduce服务 MRS

告警解释系统以用户配置的告警周期（metrics.reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Pending Compaction预估总大小持续达到用户配置的阈值

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Oozie - MapReduce服务 MRS
Oozie - MapReduce服务 MRS

基于Ext提供WEB Console，该Console仅提供对Oozie工作流的查看和监控功能。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
ALM-45649 RocksDB的Get P95耗时持续超过阈值 - MapReduce服务 MRS

检查是否缓存命中率过低查看作业TaskManager监控日志（搜索标识：RocksDBMetricPrint）中参数“rocksdb.block.cache.hit”（cache命中）和“rocksdb.block.cache.miss”（cache未命中）的值，通过如下公式计算命中率是否少于

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Producer偶现发送数据失败，日志提示“Too many open files in system” - MapReduce服务 MRS

原因分析查看Kafka服务状态： MRS Manager界面操作：登录MRS Manager，依次选择“服务管理 > Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

检查是否Level0层SST文件数过多查看作业TaskManager监控日志（搜索标识：RocksDBMetricPrint）中参数“rocksdb.num-files-at-level0”的值（单位个数）是否大于或等于“state.backend.rocksdb.level0_

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45648 RocksDB持续发生Write-Stopped - MapReduce服务 MRS

告警解释系统以用户配置的告警周期（metrics.reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB持续出现is-write-stopped，则发送告警。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

访问FusionInsight Manager（MRS 3.x及之后版本）操作场景 MRS 3.x及之后版本的集群使用FusionInsight Manager对集群进行监控、配置和管理。用户在集群安装后可使用账号登录FusionInsight Manager。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 访问集群Manager
端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

端口被占用导致RegionServer启动失败问题现象 Manager页面监控发现RegionServer状态为Restoring。原因分析通过查看RegionServer日志（/var/log/Bigdata/hbase/rs/hbase-omm-xxx.log）。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
DBServer实例一直处于Restoring状态 - MapReduce服务 MRS

原因分析 DBService组件会对“${BIGDATA_HOME}/MRS_XXX/install/dbservice/ha/module/harm/plugin/script/gsDB/.startGS.fail”这个文件监控。其中XXX是产品版本号。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用DBservice
ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

告警解释系统以用户配置的告警周期（metrics.reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB持续触发写限流，即作业写RocksDB的速率不为0时则发送告警

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

因为HBase的内存监控使用了JVM的jinfo命令，而jinfo依赖“/tmp/.java_pid*”文件，当该文件不存在时，jinfo会执行kill -3将jstack信息打印到.out日志文件里，从而导致.out日志文件过大。

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
Storm UI查看信息时显示Internal Server Error - MapReduce服务 MRS

原因分析查看Storm服务状态及监控指标： MRS Manager界面操作：登录MRS Manager，依次选择“服务管理 > Storm”，查看当前Storm状态，发现状态为良好，且监控指标内容显示正确。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Storm
Flink作业引擎概述 - MapReduce服务 MRS

流作业和批作业的状态监控。 Flink作业运维能力增强，包括原生监控页面跳转。性能&可靠性流处理支持24小时窗口聚合计算，毫秒级性能。批处理支持90天窗口聚合计算，分钟级计算完成。支持对流处理和批处理的数据进行过滤配置，过滤无效数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

因为HDFS的内存监控使用了JVM的jinfo命令，而jinfo依赖“/tmp/.java_pid*”文件，当该文件不存在时，jinfo会执行kill -3将jstack信息打印到.out日志文件里，从而导致.out日志文件过大。

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
执行Kafka Topic创建操作时发现Partition的Leader显示为none - MapReduce服务 MRS

原因分析查看Kafka服务状态： MRS Manager界面操作：登录MRS Manager，依次选择“服务管理 > Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
ClickHouse消费Kafka数据异常 - MapReduce服务 MRS

ClickHouse消费Kafka数据异常问题现象用户在ClickHouse集群创建Kafka引擎表test.user_log_kafka消费Kafka数据，查看Kafka监控发现凌晨开始出现消息堆积，数据一直没有被消费。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用ClickHouse
ALM-24005 Flume传输数据异常（2.x及以前版本） - MapReduce服务 MRS

ALM-24005 Flume传输数据异常（2.x及以前版本）告警解释告警模块对Flume Channel的容量状态进行监控，当Channel满的时长超过阈值，或Source向Channel放数据失败的次数超过阈值后，系统发送告警。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ZooKeeper与其他组件的关系 - MapReduce服务 MRS

图1 ZooKeeper和HDFS的关系 ZKFC（ZKFailoverController）作为一个ZooKeeper集群的客户端，用来监控NameNode的状态信息。ZKFC进程仅在部署了NameNode的节点中存在。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ZooKeeper
HBase操作请求次数指标中的多级图表统计如何理解？ - MapReduce服务 MRS

答：以“RegionServer级别操作请求次数”监控项为例：登录FusionInsight Manager，选择“集群 > 服务 > HBase > 资源”，在该界面即可查看“RegionServer级别操作请求次数”图表，选中“all”，则显示当前集群所有RegionServer

帮助中心 > MapReduce服务 MRS > 常见问题 > 集群管理类

总条数： 520

上一页
1
2
3
4
5
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-45650 RocksDB的Write P95耗时持续超过阈值 - MapReduce服务 MRS

ALM-45647 RocksDB的Pending Compaction预估总大小持续超过阈值 - MapReduce服务 MRS

Oozie - MapReduce服务 MRS

ALM-45649 RocksDB的Get P95耗时持续超过阈值 - MapReduce服务 MRS

Producer偶现发送数据失败，日志提示“Too many open files in system” - MapReduce服务 MRS

ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

ALM-45648 RocksDB持续发生Write-Stopped - MapReduce服务 MRS

访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

DBServer实例一直处于Restoring状态 - MapReduce服务 MRS

ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

Storm UI查看信息时显示Internal Server Error - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

执行Kafka Topic创建操作时发现Partition的Leader显示为none - MapReduce服务 MRS

ClickHouse消费Kafka数据异常 - MapReduce服务 MRS

ALM-24005 Flume传输数据异常（2.x及以前版本） - MapReduce服务 MRS

ZooKeeper与其他组件的关系 - MapReduce服务 MRS

HBase操作请求次数指标中的多级图表统计如何理解？ - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线