搜索_华为云

ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Level0层SST文件数持续达到用户配置的阈值（state.backend.rocksdb.level0_

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
下载MRS集群用户认证凭据文件 - MapReduce服务 MRS

下载认证凭据”。选择认证凭据下载位置，并配置相关参数。如果下载到服务器或远端节点，请在使用完成后及时删除，避免认证凭据泄漏。浏览器：下载到本地电脑。服务器端：下载到集群的主OMS节点上。文件生成后默认保存在主OMS节点“/tmp/FusionInsight-Keytab/”路径。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户 > 管理MRS集群用户
访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

Manager（MRS 3.x及之后版本）操作场景 MRS 3.x及之后版本的集群使用FusionInsight Manager对集群进行监控、配置和管理。用户在集群安装后可使用账号登录FusionInsight Manager。当前支持以下几种方式访问FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 访问集群Manager
端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

端口被占用导致RegionServer启动失败问题现象 Manager页面监控发现RegionServer状态为Restoring。原因分析通过查看RegionServer日志（/var/log/Bigdata/hbase/rs/hbase-omm-xxx.log）。使用lsof

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
DBServer实例一直处于Restoring状态 - MapReduce服务 MRS

nstall/dbservice/ha/module/harm/plugin/script/gsDB/.startGS.fail”这个文件监控。其中XXX是产品版本号。如果这个文件中的值大于3就会启动失败，NodeAgent会一直尝试重启该实例，此时仍会失败而且这个值每启动失败一次就会加1。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用DBservice
ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB持续触发写限流，即作业写RocksDB的速率不为0时则发送告警。当作业写RocksDB的速率为0时，则告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
查看MRS集群基本信息 - MapReduce服务 MRS

查看MRS集群基本信息集群创建完成后，可对集群进行监控和管理。选择“现有集群”，选中一集群并单击集群名，进入集群详情页面，查看集群的基本配置信息、网络信息和部署的节点信息等。 ECS集群和BMS集群在管理控制台操作基本一致，本文档主要以ECS集群描述为例，如有操作区别则分开描述。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群
ALM-45648 RocksDB持续发生Write-Stopped - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB持续出现is-write-stopped，则发送告警。当作业RocksDB在同一个告警周期内不再或不连续出现i

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

间不足。原因分析在HDFS长时间运行场景下，操作系统会把JVM创建的“/tmp/.java_pid*”文件定期清理。因为HDFS的内存监控使用了JVM的jinfo命令，而jinfo依赖“/tmp/.java_pid*”文件，当该文件不存在时，jinfo会执行kill -3将jstack信息打印到

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
执行Kafka Topic创建操作时发现Partition的Leader显示为none - MapReduce服务 MRS

Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。 FusionInsight Manager界面操作：登录FusionInsight Manager，选择“集群 > 服务 > Kafka”，查看当前Kafka状态，发现状态为良好，且监控指标内容显示正确。在Kafka概览页面获取Controller节点信息。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
ClickHouse消费Kafka数据异常 - MapReduce服务 MRS

ClickHouse消费Kafka数据异常问题现象用户在ClickHouse集群创建Kafka引擎表test.user_log_kafka消费Kafka数据，查看Kafka监控发现凌晨开始出现消息堆积，数据一直没有被消费。原因分析 Kafka出现消息堆积，说明ClickHouse消费数据时出现异常，需要查看ClickHouse的日志。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用ClickHouse
Storm UI查看信息时显示Internal Server Error - MapReduce服务 MRS

Storm集群信息较多超过系统默认Thrift传输大小的设置。原因分析查看Storm服务状态及监控指标： MRS Manager界面操作：登录MRS Manager，依次选择“服务管理 > Storm”，查看当前Storm状态，发现状态为良好，且监控指标内容显示正确。 FusionInsight Manager

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Storm
HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

足。原因分析在HBase长时间运行场景下，操作系统会把JVM创建的“/tmp/.java_pid*”文件定期清理。因为HBase的内存监控使用了JVM的jinfo命令，而jinfo依赖“/tmp/.java_pid*”文件，当该文件不存在时，jinfo会执行kill -3将jstack信息打印到

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
成本管理 - MapReduce服务 MRS
成本管理 - MapReduce服务 MRS

资源优化您可以通过云监控服务监控资源的使用情况，识别空闲资源，寻找节约成本的机会。也可以根据成本分析阶段的分析结果识别成本偏高的资源，然后采取针对性的优化措施。监控资源利用率，评估当前配置是否过高。例如：CPU、内存、云硬盘、带宽等资源的利用率。监控闲置的资源，避免浪费。例如：未挂载的云硬盘、未绑定的EIP等。

帮助中心 > MapReduce服务 MRS > 计费说明
通过API提交Spark作业后作业状态为error - MapReduce服务 MRS

/log4j.properties”中的日志级别，使用API V1.1接口作业提交后，状态显示为error。原因分析 executor会监控作业日志回显，确定作业执行结果，改为error后，检测不到输出结果，因此过期后判断作业状态为异常。处理步骤将“/opt/client/

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
HBase操作请求次数指标中的多级图表统计如何理解？ - MapReduce服务 MRS

HBase操作请求次数指标中的多级图表统计如何理解？问： HBase操作请求次数指标中的多级图表统计如何理解？答：以“RegionServer级别操作请求次数”监控项为例：登录FusionInsight Manager，选择“集群 > 服务 > HBase > 资源”，在该界面即可查看“Region

帮助中心 > MapReduce服务 MRS > 常见问题 > 集群管理类
ZooKeeper与其他组件的关系 - MapReduce服务 MRS

图1 ZooKeeper和HDFS的关系 ZKFC（ZKFailoverController）作为一个ZooKeeper集群的客户端，用来监控NameNode的状态信息。ZKFC进程仅在部署了NameNode的节点中存在。HDFS NameNode的Active和Standby节点均部署有ZKFC进程。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ZooKeeper
OpenTSDB应用开发常用概念 - MapReduce服务 MRS

point：时间序列数据点，包括metric、timestamp、value和tag。表示某个metric在某个时间点的数值。 metric：指标项。例如，在系统监控中的CPU使用率、内存、IO等指标。 timestamp：UNIX时间戳（自Epoch以来的秒或毫秒），即value产生的时间。 valu

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > OpenTSDB开发指南 > OpenTSDB应用开发概述
ALM-24005 Flume传输数据异常 - MapReduce服务 MRS

ALM-24005 Flume传输数据异常告警解释告警模块对Flume Channel的容量状态进行监控，当Channel满的时长超过阈值，或Source向Channel放数据失败的次数超过阈值后，系统即时上报告警。默认阈值为10，用户可通过conf目录下的配置文件properties

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-24005 Flume传输数据异常（2.x及以前版本） - MapReduce服务 MRS

ALM-24005 Flume传输数据异常（2.x及以前版本）告警解释告警模块对Flume Channel的容量状态进行监控，当Channel满的时长超过阈值，或Source向Channel放数据失败的次数超过阈值后，系统发送告警。用户可通过配置修改阈值：修改对应chann

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 1636

上一页
1
2
3
4
5
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

下载MRS集群用户认证凭据文件 - MapReduce服务 MRS

访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

DBServer实例一直处于Restoring状态 - MapReduce服务 MRS

ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

查看MRS集群基本信息 - MapReduce服务 MRS

ALM-45648 RocksDB持续发生Write-Stopped - MapReduce服务 MRS

HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

执行Kafka Topic创建操作时发现Partition的Leader显示为none - MapReduce服务 MRS

ClickHouse消费Kafka数据异常 - MapReduce服务 MRS

Storm UI查看信息时显示Internal Server Error - MapReduce服务 MRS

HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

成本管理 - MapReduce服务 MRS

通过API提交Spark作业后作业状态为error - MapReduce服务 MRS

HBase操作请求次数指标中的多级图表统计如何理解？ - MapReduce服务 MRS

ZooKeeper与其他组件的关系 - MapReduce服务 MRS

OpenTSDB应用开发常用概念 - MapReduce服务 MRS

ALM-24005 Flume传输数据异常 - MapReduce服务 MRS

ALM-24005 Flume传输数据异常（2.x及以前版本） - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线