搜索_华为云

ALM-45649 RocksDB的Get P95耗时持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Get P95耗时达到用户配置的阈值（metrics.reporter.alarm.job.alarm.rocksdb

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45648 RocksDB持续发生Write-Stopped - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB持续出现is-write-stopped，则发送告警。当作业RocksDB在同一个告警周期内不再或不连续出现i

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Level0层SST文件数持续达到用户配置的阈值（state.backend.rocksdb.level0_

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Producer偶现发送数据失败，日志提示“Too many open files in system” - MapReduce服务 MRS

Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。 FusionInsight Manager界面操作：登录FusionInsight Manager，选择“集群 > 服务 > Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。查看SparkS

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
购买MRS集群，提交订单时，报无效认证如何处理？ - MapReduce服务 MRS

购买MRS集群，提交订单时，报无效认证如何处理？问：购买MRS集群，提交订单时，报无效认证，怎么办？答：通过管理人员检查API请求日志发现告警信息为细粒度策略中未赋予IAM用户“mrs:cluster:create”的权限导致。分析原因为当前IAM用户归属在多个用户组内

 帮助中心 > MapReduce服务 MRS > 常见问题 > 集群创建类
Storm UI查看信息时显示Internal Server Error - MapReduce服务 MRS

Storm集群信息较多超过系统默认Thrift传输大小的设置。原因分析查看Storm服务状态及监控指标： MRS Manager界面操作：登录MRS Manager，依次选择“服务管理 > Storm”，查看当前Storm状态，发现状态为良好，且监控指标内容显示正确。 FusionInsight Manager

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Storm
HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

足。原因分析在HBase长时间运行场景下，操作系统会把JVM创建的“/tmp/.java_pid*”文件定期清理。因为HBase的内存监控使用了JVM的jinfo命令，而jinfo依赖“/tmp/.java_pid*”文件，当该文件不存在时，jinfo会执行kill -3将jstack信息打印到

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB持续触发写限流，即作业写RocksDB的速率不为0时则发送告警。当作业写RocksDB的速率为0时，则告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

端口被占用导致RegionServer启动失败问题现象 Manager页面监控发现RegionServer状态为Restoring。原因分析通过查看RegionServer日志（/var/log/Bigdata/hbase/rs/hbase-omm-xxx.log）。使用lsof

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
DBServer实例一直处于Restoring状态 - MapReduce服务 MRS

nstall/dbservice/ha/module/harm/plugin/script/gsDB/.startGS.fail”这个文件监控。其中XXX是产品版本号。如果这个文件中的值大于3就会启动失败，NodeAgent会一直尝试重启该实例，此时仍会失败而且这个值每启动失败一次就会加1。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用DBservice
访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

Manager（MRS 3.x及之后版本）操作场景 MRS 3.x及之后版本的集群使用FusionInsight Manager对集群进行监控、配置和管理。用户在集群安装后可使用账号登录FusionInsight Manager。当前支持以下几种方式访问FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 访问集群Manager
如何关闭ZooKeeper的SASL认证？ - MapReduce服务 MRS

如何关闭ZooKeeper的SASL认证？问：怎么关闭ZooKeeper SASL认证？答：登录FusionInsight Manager。选择“集群 > 服务 > ZooKeeper > 配置 > 全部配置”。在左侧导航栏选择“quorumpeer > 自定义”添加参数名称和值：zookeeper

帮助中心 > MapReduce服务 MRS > 常见问题 > 客户端使用类
HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

间不足。原因分析在HDFS长时间运行场景下，操作系统会把JVM创建的“/tmp/.java_pid*”文件定期清理。因为HDFS的内存监控使用了JVM的jinfo命令，而jinfo依赖“/tmp/.java_pid*”文件，当该文件不存在时，jinfo会执行kill -3将jstack信息打印到

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ALM-24005 Flume传输数据异常（2.x及以前版本） - MapReduce服务 MRS

ALM-24005 Flume传输数据异常（2.x及以前版本）告警解释告警模块对Flume Channel的容量状态进行监控，当Channel满的时长超过阈值，或Source向Channel放数据失败的次数超过阈值后，系统发送告警。用户可通过配置修改阈值：修改对应chann

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
执行Kafka Topic创建操作时发现Partition的Leader显示为none - MapReduce服务 MRS

Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。 FusionInsight Manager界面操作：登录FusionInsight Manager，选择“集群 > 服务 > Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。在Kafka概览页面获取Controller节点信息。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
ClickHouse消费Kafka数据异常 - MapReduce服务 MRS

ClickHouse消费Kafka数据异常问题现象用户在ClickHouse集群创建Kafka引擎表test.user_log_kafka消费Kafka数据，查看Kafka监控发现凌晨开始出现消息堆积，数据一直没有被消费。原因分析 Kafka出现消息堆积，说明ClickHouse消费数据时出现异常，需要查看ClickHouse的日志。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用ClickHouse
使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

发。迁移效率高：基于分布式计算框架进行数据任务执行和数据传输优化，并针对特定数据源写入做了专项优化，迁移效率高。实时监控：迁移过程中可以执行自动实时监控、告警和通知操作。约束与限制搬迁数据量较大时，对网络通信要求较高，执行搬迁任务时，可能会影响其他业务，建议在业务空闲期进行数据迁移任务。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
技术支持 - MapReduce服务 MRS
技术支持 - MapReduce服务 MRS

集群时的默认安全组规则等。不负责对用户在MRS集群环境上自建安装的非MRS提供的第三方组件的问题排查和解决。智能数据专家服务如需获得更多支持，可咨询购买对应的智能数据专家服务：https://www.huaweicloud.com/service/intelligencedata

帮助中心 > MapReduce服务 MRS > 产品介绍
调整Yarn任务抢占机制 - MapReduce服务 MRS

resourcemanager.scheduler.monitor.policies”中的策略，启用新的scheduler监控。设置为“true”表示启用监控，并根据scheduler的信息，启动抢占的功能。设置为“false”表示不启用。 false yarn.resourcemanager

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
ZooKeeper与其他组件的关系 - MapReduce服务 MRS

图1 ZooKeeper和HDFS的关系 ZKFC（ZKFailoverController）作为一个ZooKeeper集群的客户端，用来监控NameNode的状态信息。ZKFC进程仅在部署了NameNode的节点中存在。HDFS NameNode的Active和Standby节点均部署有ZKFC进程。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ZooKeeper

总条数： 376

上一页
1
2
3
4
5
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-45649 RocksDB的Get P95耗时持续超过阈值 - MapReduce服务 MRS

ALM-45648 RocksDB持续发生Write-Stopped - MapReduce服务 MRS

ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

Producer偶现发送数据失败，日志提示“Too many open files in system” - MapReduce服务 MRS

购买MRS集群，提交订单时，报无效认证如何处理？ - MapReduce服务 MRS

Storm UI查看信息时显示Internal Server Error - MapReduce服务 MRS

HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

DBServer实例一直处于Restoring状态 - MapReduce服务 MRS

访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

如何关闭ZooKeeper的SASL认证？ - MapReduce服务 MRS

HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

ALM-24005 Flume传输数据异常（2.x及以前版本） - MapReduce服务 MRS

执行Kafka Topic创建操作时发现Partition的Leader显示为none - MapReduce服务 MRS

ClickHouse消费Kafka数据异常 - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

技术支持 - MapReduce服务 MRS

调整Yarn任务抢占机制 - MapReduce服务 MRS

ZooKeeper与其他组件的关系 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线