搜索_华为云

ALM-45643 RocksDB的MemTable大小持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的MemTable大小持续超过用户配置的阈值（metrics.reporter.alarm.job.alarm

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
YARN基本原理 - MapReduce服务 MRS
YARN基本原理 - MapReduce服务 MRS

调度/监控）分离，主要方法是创建一个全局的ResourceManager（RM）和若干个针对应用程序的ApplicationMaster（AM）。如需使用YARN，请确保MRS集群内已安装Hadoop服务。应用程序是指传统的MapReduce作业或作业的DAG（有向无环图）。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
ALM-45645 RocksDB的Pending Flush持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Pending Flush请求数持续达到flush/compaction线程数的n倍，则发送告警。当作业RocksDB的Pending

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45650 RocksDB的Write P95耗时持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Write P95耗时达到用户配置的阈值（metrics.reporter.alarm.job.alarm.rocksdb

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45647 RocksDB的Pending Compaction预估总大小持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Pending Compaction预估总大小持续达到用户配置的阈值，则发送告警。当作业RocksDB的Pending

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45649 RocksDB的Get P95耗时持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Get P95耗时达到用户配置的阈值（metrics.reporter.alarm.job.alarm.rocksdb

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Producer偶现发送数据失败，日志提示“Too many open files in system” - MapReduce服务 MRS

Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。 FusionInsight Manager界面操作：登录FusionInsight Manager，选择“集群 > 服务 > Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。查看SparkS

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Level0层SST文件数持续达到用户配置的阈值（state.backend.rocksdb.level0_

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

Manager（MRS 3.x及之后版本）操作场景 MRS 3.x及之后版本的集群使用FusionInsight Manager对集群进行监控、配置和管理。用户在集群安装后可使用账号登录FusionInsight Manager。当前支持以下几种方式访问FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 访问集群Manager
端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

端口被占用导致RegionServer启动失败问题现象 Manager页面监控发现RegionServer状态为Restoring。原因分析通过查看RegionServer日志（/var/log/Bigdata/hbase/rs/hbase-omm-xxx.log）。使用lsof

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
DBServer实例一直处于Restoring状态 - MapReduce服务 MRS

nstall/dbservice/ha/module/harm/plugin/script/gsDB/.startGS.fail”这个文件监控。其中XXX是产品版本号。如果这个文件中的值大于3就会启动失败，NodeAgent会一直尝试重启该实例，此时仍会失败而且这个值每启动失败一次就会加1。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用DBservice
ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB持续触发写限流，即作业写RocksDB的速率不为0时则发送告警。当作业写RocksDB的速率为0时，则告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45648 RocksDB持续发生Write-Stopped - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB持续出现is-write-stopped，则发送告警。当作业RocksDB在同一个告警周期内不再或不连续出现i

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

间不足。原因分析在HDFS长时间运行场景下，操作系统会把JVM创建的“/tmp/.java_pid*”文件定期清理。因为HDFS的内存监控使用了JVM的jinfo命令，而jinfo依赖“/tmp/.java_pid*”文件，当该文件不存在时，jinfo会执行kill -3将jstack信息打印到

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
执行Kafka Topic创建操作时发现Partition的Leader显示为none - MapReduce服务 MRS

Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。 FusionInsight Manager界面操作：登录FusionInsight Manager，选择“集群 > 服务 > Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。在Kafka概览页面获取Controller节点信息。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
ClickHouse消费Kafka数据异常 - MapReduce服务 MRS

ClickHouse消费Kafka数据异常问题现象用户在ClickHouse集群创建Kafka引擎表test.user_log_kafka消费Kafka数据，查看Kafka监控发现凌晨开始出现消息堆积，数据一直没有被消费。原因分析 Kafka出现消息堆积，说明ClickHouse消费数据时出现异常，需要查看ClickHouse的日志。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用ClickHouse
Storm UI查看信息时显示Internal Server Error - MapReduce服务 MRS

Storm集群信息较多超过系统默认Thrift传输大小的设置。原因分析查看Storm服务状态及监控指标： MRS Manager界面操作：登录MRS Manager，依次选择“服务管理 > Storm”，查看当前Storm状态，发现状态为良好，且监控指标内容显示正确。 FusionInsight Manager

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Storm
HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

足。原因分析在HBase长时间运行场景下，操作系统会把JVM创建的“/tmp/.java_pid*”文件定期清理。因为HBase的内存监控使用了JVM的jinfo命令，而jinfo依赖“/tmp/.java_pid*”文件，当该文件不存在时，jinfo会执行kill -3将jstack信息打印到

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
通过API提交Spark作业后作业状态为error - MapReduce服务 MRS

/log4j.properties”中的日志级别，使用API V1.1接口作业提交后，状态显示为error。原因分析 executor会监控作业日志回显，确定作业执行结果，改为error后，检测不到输出结果，因此过期后判断作业状态为异常。处理步骤将“/opt/client/

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
HBase操作请求次数指标中的多级图表统计如何理解？ - MapReduce服务 MRS

HBase操作请求次数指标中的多级图表统计如何理解？问： HBase操作请求次数指标中的多级图表统计如何理解？答：以“RegionServer级别操作请求次数”监控项为例：登录FusionInsight Manager，选择“集群 > 服务 > HBase > 资源”，在该界面即可查看“Region

帮助中心 > MapReduce服务 MRS > 常见问题 > 集群管理类

总条数： 400

上一页
1
2
3
4
5
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-45643 RocksDB的MemTable大小持续超过阈值 - MapReduce服务 MRS

YARN基本原理 - MapReduce服务 MRS

ALM-45645 RocksDB的Pending Flush持续超过阈值 - MapReduce服务 MRS

ALM-45650 RocksDB的Write P95耗时持续超过阈值 - MapReduce服务 MRS

ALM-45647 RocksDB的Pending Compaction预估总大小持续超过阈值 - MapReduce服务 MRS

ALM-45649 RocksDB的Get P95耗时持续超过阈值 - MapReduce服务 MRS

Producer偶现发送数据失败，日志提示“Too many open files in system” - MapReduce服务 MRS

ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

DBServer实例一直处于Restoring状态 - MapReduce服务 MRS

ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

ALM-45648 RocksDB持续发生Write-Stopped - MapReduce服务 MRS

HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

执行Kafka Topic创建操作时发现Partition的Leader显示为none - MapReduce服务 MRS

ClickHouse消费Kafka数据异常 - MapReduce服务 MRS

Storm UI查看信息时显示Internal Server Error - MapReduce服务 MRS

HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

通过API提交Spark作业后作业状态为error - MapReduce服务 MRS

HBase操作请求次数指标中的多级图表统计如何理解？ - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线