搜索_华为云

ALM-45650 RocksDB的Write P95耗时持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Write P95耗时达到用户配置的阈值（metrics.reporter.alarm.job.alarm.rocksdb

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45645 RocksDB的Pending Flush持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Pending Flush请求数持续达到flush/compaction线程数的n倍，则发送告警。当作业RocksDB的Pending

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
补丁基本信息说明 - MapReduce服务 MRS

Hive监控告警增强，新增MetaStore只操作DB接口的耗时、HiveServer建立连接/关闭连接耗时、MetaStore操作DB接口的耗时监控。 Hive新增MetaStore连接数监控告警、SQL平均运行时间监控、扫描分区数监控和user、IP维度监控。 Hive

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.1.0.0.16补丁说明
ALM-45643 RocksDB的MemTable大小持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的MemTable大小持续超过用户配置的阈值（metrics.reporter.alarm.job.alarm

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45649 RocksDB的Get P95耗时持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Get P95耗时达到用户配置的阈值（metrics.reporter.alarm.job.alarm.rocksdb

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43009 JobHistory GC 时间超出阈值（2.x及以前版本） - MapReduce服务 MRS

产生告警的主机名。对系统的影响 GC时间超出阈值，会影响JobHistory进程运行的性能，甚至造成JobHistory进程不可用。可能原因该节点JobHistory进程堆内存使用率过大，或配置的堆内存不合理，导致进程GC频繁。处理步骤检查GC时间。登录MRS集群详情页面，选择“告警管理”。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12075 pms资源异常 - MapReduce服务 MRS

nInsight Manager平台，无法进行正常运维操作。 pms进程持续重启，导致告警上报时间段监控数据采集异常，严重时可导致告警上报时间段监控数据丢失。可能原因 pms进程异常。处理步骤检查pms进程是否异常。打开FusionInsight Manager页面，在告

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
MRS集群内节点互信异常如何处理？ - MapReduce服务 MRS

确认是否有identities信息。如果没有identities信息，执行ps -ef|grep ssh-agent找到ssh-agent进程，并kill该进程等待该进程自动重启。执行ssh-add -l 查看是否已经添加identities信息，如果已经添加，请手动ssh确认互信是否正常。

帮助中心 > MapReduce服务 MRS > 常见问题 > 节点管理类
ALM-12073 cep资源异常 - MapReduce服务 MRS

nInsight Manager平台，无法进行正常运维操作。 cep进程持续重启，导致告警上报时间段监控数据采集异常，严重时可导致告警上报时间段监控数据丢失。可能原因 cep进程异常。处理步骤检查cep进程是否异常。打开FusionInsight Manager页面，在告

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45647 RocksDB的Pending Compaction预估总大小持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Pending Compaction预估总大小持续达到用户配置的阈值，则发送告警。当作业RocksDB的Pending

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Flume数据采集慢 - MapReduce服务 MRS

Flume数据采集慢问题现象 Flume启动后，Flume数据采集慢。原因分析 Flume堆内存设置不合理，导致Flume进程一直处于频繁GC。查看Flume运行日志： 2019-02-26T13:06:20.666+0800: 1085673.512: [Full GC:[CMS:

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Flume
MRS集群反复上报43006告警 - MapReduce服务 MRS

MRS集群反复上报43006告警用户问题集群反复出现“ALM-43006 JobHistory进程堆内存使用超出阈值”告警，且按照告警参考处理无效。问题现象集群出现告警“ALM-43006 JobHistory进程堆内存使用超出阈值”并且按照指导处理以后，运行一段时间又会出现同样的告警。原因分析

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
ALM-45648 RocksDB持续发生Write-Stopped - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB持续出现is-write-stopped，则发送告警。当作业RocksDB在同一个告警周期内不再或不连续出现i

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45292 PolicySync垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

ALM-45292 PolicySync垃圾回收(GC)时间超过阈值告警解释系统每60秒周期性检测PolicySync进程的垃圾回收（GC）占用时间，当连续5次检测到PolicySync进程的垃圾回收（GC）时间超出阈值时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。告警属性告警ID

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12041 关键文件权限异常 - MapReduce服务 MRS

okerberos、oldap关键文件权限异常，会导致认证失败，可能会导致作业运行失败。 controller、pms关键文件权限异常，会导致进程故障，可能会影响弹性扩缩容性能。 tomcat关键文件权限异常，会影响Manager页面登录、查看功能。可能原因用户手动修改了文件权限

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

reporter.alarm.job.alarm.rocksdb.metrics.duration，默认180s）检查作业RocksDB监控数据，如果作业RocksDB的Level0层SST文件数持续达到用户配置的阈值（state.backend.rocksdb.level0_

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
MRS 2.1.0.9补丁说明 - MapReduce服务 MRS

LISTEN查询tomcat的进程号。执行kill -9 {pid}，其中{pid}为上一步中查询到的进程号。等待进程自动重启，可以执行netstat -anp |grep 28443 |grep LISTEN查看进程是否启动，如果可以查到结果说明进程启动成功。为各组件添加或修

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
访问MRS集群Manager（2.x及之前版本） - MapReduce服务 MRS

访问MRS集群Manager（2.x及之前版本）访问MRS集群Manager场景 MRS集群提供Manager对集群进行监控、配置和管理，用户在集群安装后可使用admin用户登录Manager页面。当前支持以下几种方式访问Manager，请根据实际情况进行选择：通过弹性IP访问FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 存算分离常见问题
ALM-45280 RangerAdmin垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

RangerAdmin垃圾回收(GC)时间超过阈值告警解释系统每60秒周期性检测RangerAdmin进程的垃圾回收（GC）占用时间，当连续5次检测到RangerAdmin进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。告警属性

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-13007 ZooKeeper客户端可用连接数不足 - MapReduce服务 MRS

对系统的影响大量进程连接到ZooKeeper，导致ZooKeeper连接数被占满，无法对外正常提供服务，导致上游组件（例如Yarn、Flink、Spark等）服务异常。可能原因客户端大量进程连接到ZooKeeper，或者自定义阈值设置不合理。处理步骤检查客户端是否存在大量进程连接ZooKeeper的情况

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 1040

上一页
1
...
9
10
11
...
52
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-45650 RocksDB的Write P95耗时持续超过阈值 - MapReduce服务 MRS

ALM-45645 RocksDB的Pending Flush持续超过阈值 - MapReduce服务 MRS

补丁基本信息说明 - MapReduce服务 MRS

ALM-45643 RocksDB的MemTable大小持续超过阈值 - MapReduce服务 MRS

ALM-45649 RocksDB的Get P95耗时持续超过阈值 - MapReduce服务 MRS

ALM-43009 JobHistory GC 时间超出阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-12075 pms资源异常 - MapReduce服务 MRS

MRS集群内节点互信异常如何处理？ - MapReduce服务 MRS

ALM-12073 cep资源异常 - MapReduce服务 MRS

ALM-45647 RocksDB的Pending Compaction预估总大小持续超过阈值 - MapReduce服务 MRS

Flume数据采集慢 - MapReduce服务 MRS

MRS集群反复上报43006告警 - MapReduce服务 MRS

ALM-45648 RocksDB持续发生Write-Stopped - MapReduce服务 MRS

ALM-45292 PolicySync垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

ALM-12041 关键文件权限异常 - MapReduce服务 MRS

ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

MRS 2.1.0.9补丁说明 - MapReduce服务 MRS

访问MRS集群Manager（2.x及之前版本） - MapReduce服务 MRS

ALM-45280 RangerAdmin垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

ALM-13007 ZooKeeper客户端可用连接数不足 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线