搜索_华为云

ALM-45649 RocksDB的Get P95耗时持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Get P95耗时达到用户配置的阈值（metrics.reporter.alarm.job.alarm.rocksdb

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45645 RocksDB的Pending Flush持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Pending Flush请求数持续达到flush/compaction线程数的n倍，则发送告警。当作业RocksDB的Pending

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45650 RocksDB的Write P95耗时持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Write P95耗时达到用户配置的阈值（metrics.reporter.alarm.job.alarm.rocksdb

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Level0层SST文件数持续达到用户配置的阈值（state.backend.rocksdb.level0_

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45647 RocksDB的Pending Compaction预估总大小持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Pending Compaction预估总大小持续达到用户配置的阈值，则发送告警。当作业RocksDB的Pending

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
什么是MapReduce服务 - MapReduce服务 MRS

用于数据分析结果的呈现，并与数据治理中心DataArts Studio集成，提供一站式的大数据协同开发平台，帮助用户轻松完成数据建模、数据集成、脚本开发、作业调度、运维监控等多项任务，可以极大降低用户使用大数据的门槛，帮助用户快速构建大数据处理中心。集群管理以Hadoop为基础的大数据生态的各种组件均是以

 帮助中心 > MapReduce服务 MRS > 产品介绍
Storm UI查看信息时显示Internal Server Error - MapReduce服务 MRS

Storm集群信息较多超过系统默认Thrift传输大小的设置。原因分析查看Storm服务状态及监控指标： MRS Manager界面操作：登录MRS Manager，依次选择“服务管理 > Storm”，查看当前Storm状态，发现状态为良好，且监控指标内容显示正确。 FusionInsight Manager

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Storm
访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

Manager（MRS 3.x及之后版本）操作场景 MRS 3.x及之后版本的集群使用FusionInsight Manager对集群进行监控、配置和管理。用户在集群安装后可使用账号登录FusionInsight Manager。当前支持以下几种方式访问FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 访问集群Manager
Producer偶现发送数据失败，日志提示“Too many open files in system” - MapReduce服务 MRS

Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。 FusionInsight Manager界面操作：登录FusionInsight Manager，选择“集群 > 服务 > Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。查看SparkS

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

端口被占用导致RegionServer启动失败问题现象 Manager页面监控发现RegionServer状态为Restoring。原因分析通过查看RegionServer日志（/var/log/Bigdata/hbase/rs/hbase-omm-xxx.log）。使用lsof

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB持续触发写限流，即作业写RocksDB的速率不为0时则发送告警。当作业写RocksDB的速率为0时，则告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

足。原因分析在HBase长时间运行场景下，操作系统会把JVM创建的“/tmp/.java_pid*”文件定期清理。因为HBase的内存监控使用了JVM的jinfo命令，而jinfo依赖“/tmp/.java_pid*”文件，当该文件不存在时，jinfo会执行kill -3将jstack信息打印到

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

发。迁移效率高：基于分布式计算框架进行数据任务执行和数据传输优化，并针对特定数据源写入做了专项优化，迁移效率高。实时监控：迁移过程中可以执行自动实时监控、告警和通知操作。约束与限制搬迁数据量较大时，对网络通信要求较高，执行搬迁任务时，可能会影响其他业务，建议在业务空闲期进行数据迁移任务。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

间不足。原因分析在HDFS长时间运行场景下，操作系统会把JVM创建的“/tmp/.java_pid*”文件定期清理。因为HDFS的内存监控使用了JVM的jinfo命令，而jinfo依赖“/tmp/.java_pid*”文件，当该文件不存在时，jinfo会执行kill -3将jstack信息打印到

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
DBServer实例一直处于Restoring状态 - MapReduce服务 MRS

nstall/dbservice/ha/module/harm/plugin/script/gsDB/.startGS.fail”这个文件监控。其中XXX是产品版本号。如果这个文件中的值大于3就会启动失败，NodeAgent会一直尝试重启该实例，此时仍会失败而且这个值每启动失败一次就会加1。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用DBservice
Flink Job Pipeline增强 - MapReduce服务 MRS

随着业务逻辑越来越复杂，Jar包的大小也不断增加。协调难度增大，所有的业务开发人员都在同一套业务逻辑上开发，虽然可以将整个业务逻辑划分为几个模块，但各模块之间是一种紧耦合的关系，当需求更改时，需要重新规划整个流图。拆分成多个作业目前还存在问题。通常情况下，作业之间可以通过Kafka实

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
HDFS性能差导致HBase服务不可用告警 - MapReduce服务 MRS

HDFS性能差导致HBase服务不可用告警问题现象 HBase组件不断上报服务不可用告警。原因分析该问题多半为HDFS性能较慢，导致健康检查超时，从而导致监控告警。可通过以下方式判断：首先查看HMaster日志（“/var/log/Bigdata/hbase/hm/hbase-omm-xxx.

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
MRS集群日志概述 - MapReduce服务 MRS

配置SSO信息删除健康检查历史报告修改集群属性同步维护命令异步维护命令定制报表监控指标导出报表监控数据 SNMP执行异步命令重启WEB服务定制静态资源池监控指标导出静态资源池监控数据定制主页监控指标中止任务还原配置修改域和互信的配置修改系统参数集群进入维护模式集群退出维护模式

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群日志
ZooKeeper与其他组件的关系 - MapReduce服务 MRS

图1 ZooKeeper和HDFS的关系 ZKFC（ZKFailoverController）作为一个ZooKeeper集群的客户端，用来监控NameNode的状态信息。ZKFC进程仅在部署了NameNode的节点中存在。HDFS NameNode的Active和Standby节点均部署有ZKFC进程。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ZooKeeper
HBase操作请求次数指标中的多级图表统计如何理解？ - MapReduce服务 MRS

HBase操作请求次数指标中的多级图表统计如何理解？问： HBase操作请求次数指标中的多级图表统计如何理解？答：以“RegionServer级别操作请求次数”监控项为例：登录FusionInsight Manager，选择“集群 > 服务 > HBase > 资源”，在该界面即可查看“Region

帮助中心 > MapReduce服务 MRS > 常见问题 > 集群管理类

总条数： 557

上一页
1
...
4
5
6
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-45649 RocksDB的Get P95耗时持续超过阈值 - MapReduce服务 MRS

ALM-45645 RocksDB的Pending Flush持续超过阈值 - MapReduce服务 MRS

ALM-45650 RocksDB的Write P95耗时持续超过阈值 - MapReduce服务 MRS

ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

ALM-45647 RocksDB的Pending Compaction预估总大小持续超过阈值 - MapReduce服务 MRS

什么是MapReduce服务 - MapReduce服务 MRS

Storm UI查看信息时显示Internal Server Error - MapReduce服务 MRS

访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

Producer偶现发送数据失败，日志提示“Too many open files in system” - MapReduce服务 MRS

端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

DBServer实例一直处于Restoring状态 - MapReduce服务 MRS

Flink Job Pipeline增强 - MapReduce服务 MRS

HDFS性能差导致HBase服务不可用告警 - MapReduce服务 MRS

MRS集群日志概述 - MapReduce服务 MRS

ZooKeeper与其他组件的关系 - MapReduce服务 MRS

HBase操作请求次数指标中的多级图表统计如何理解？ - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线