搜索_华为云

ALM-45647 RocksDB的Pending Compaction预估总大小持续超过阈值 - MapReduce服务 MRS

产生告警的集群名称。服务名产生告警的服务名称。应用名产生告警的应用名称。角色名产生告警的角色名称。任务名产生告警的作业名称。对系统的影响 Flink作业RocksDB的Pending Compaction预估总大小持续超过阈值，主要反应的是Flink作业的Chec

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
补丁基本信息说明 - MapReduce服务 MRS

解决/etc/hosts关键配置异常新增告警的问题。解决精细化监控指标名称过长导致监控分表机制失效的问题。解决GaussDB健康检查异常，导致实例重启的问题。解决磁盘监控指标计算错误的问题。解决主机内存使用率计算错误的问题。解决主机列表偶现丢失故障主机的问题。解决租户资源修改用户策略功能无法使用的问题。解决IAM用户同步失败的问题。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.10补丁说明
ALM-45649 RocksDB的Get P95耗时持续超过阈值 - MapReduce服务 MRS

来源产生告警的集群名称。服务名产生告警的服务名称。应用名产生告警的应用名称。角色名产生告警的角色名称。任务名产生告警的作业名称。对系统的影响 Flink作业RocksDB的Get P95耗时持续超过阈值，主要反应的是Flink作业的CheckPoint的性能，对FlinkServer本身没有影响。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

产生告警的集群名称。服务名产生告警的服务名称。应用名产生告警的应用名称。角色名产生告警的角色名称。任务名产生告警的作业名称。对系统的影响 Flink作业RocksDB的Level0层SST文件数持续超过阈值，主要反应的是Flink作业的CheckPoint的性能，对FlinkServer本身没有影响。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
执行MRS集群健康检查 - MapReduce服务 MRS

集群健康检查包含检查对象的“健康状态”、相关的告警和自定义的监控指标等三项检查项，但检查结果不能等同于界面上显示的“健康状态”。检查范围包含Manager、服务级别和主机级别的健康检查： Manager关注集群统一管理平台是否提供正常管理功能。服务级别关注组件是否能够提供正常的服务。主机级别关注主机的一系列指标是否正常。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群健康检查
执行MRS集群节点健康检查 - MapReduce服务 MRS

执行MRS集群节点健康检查如果某个主机节点的运行状态不是良好，用户可以执行主机健康检查，快速确认某些基本功能是否存在异常。在日常运维中，管理员也可以执行主机健康检查，以保证主机上各角色实例的配置参数以及监控没有异常、能够长时间稳定运行。执行集群节点健康检查（3.x及之后版本）

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群健康检查
ALM-45648 RocksDB持续发生Write-Stopped - MapReduce服务 MRS

产生告警的集群名称。服务名产生告警的服务名称。应用名产生告警的应用名称。角色名产生告警的角色名称。任务名产生告警的作业名称。对系统的影响 Flink作业RocksDB持续发生is-write-stopped，主要反应的是Flink作业的CheckPoint的性能，对FlinkServer本身没有影响。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

参数含义来源产生告警的集群名称。服务名产生告警的服务名称。应用名产生告警的应用名称。角色名产生告警的角色名称。任务名产生告警的作业名称。对系统的影响 Flink作业RocksDB持续触发写限流，主要反应的是Flink作业的CheckPoint的性能，对Flinkserver本身没有影响。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
如何防止insert overwrite语句误操作导致数据丢失 - MapReduce服务 MRS

Hive、HDFS组件功能正常。操作步骤登录FusionInsight Manager。选择“集群 > 待操作集群的名称 > 服务 > Hive > 配置 > 全部配置”，搜索“hive.local.dir.confblacklist”配置项。在该配置项中添加用户要重点保护的数据库、表或目录路径。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
如何防止insert overwrite语句误操作导致数据丢失 - MapReduce服务 MRS

Hive、HDFS组件功能正常。操作步骤登录FusionInsight Manager。选择“集群 > 待操作集群的名称 > 服务 > Hive > 配置 > 全部配置”，搜索“hive.local.dir.confblacklist”配置项。在该配置项中添加用户要重点保护的数据库、表或目录路径。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

在HBase长时间运行场景下，操作系统会把JVM创建的“/tmp/.java_pid*”文件定期清理。因为HBase的内存监控使用了JVM的jinfo命令，而jinfo依赖“/tmp/.java_pid*”文件，当该文件不存在时，jinfo会执行kill -3将jstack信息打印到.out日志文件里，从而导致.out日志文件过大。

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

在“安全组”中选择当前集群所在的安全组，该安全组在创建集群时配置或集群自动创建。创建自定义集群时，安全组可配置提前创建的安全组或保持默认“自动创建”；快速创建集群时，安全组由集群自动创建。安全组名称可在集群的“概览”界面的“安全组”查看。添加安全组规则，默认填充的是用户访问弹性IP地址的规则，如

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 访问集群Manager
端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

使用lsof -i:21302（MRS1.7.X及以后端口号是16020）查看到pid，然后根据pid查看到相应的进程，发现RegionServer的端口被DFSZkFailoverController占用。查看“/proc/sys/net/ipv4/ip_local_port_range”显示为“9000

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
DBServer实例一直处于Restoring状态 - MapReduce服务 MRS

rvice/ha/module/harm/plugin/script/gsDB/.startGS.fail”这个文件监控。其中XXX是产品版本号。如果这个文件中的值大于3就会启动失败，NodeAgent会一直尝试重启该实例，此时仍会失败而且这个值每启动失败一次就会加1。解决办法

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用DBservice
Storm UI查看信息时显示Internal Server Error - MapReduce服务 MRS

Storm集群信息较多超过系统默认Thrift传输大小的设置。原因分析查看Storm服务状态及监控指标： MRS Manager界面操作：登录MRS Manager，依次选择“服务管理 > Storm”，查看当前Storm状态，发现状态为良好，且监控指标内容显示正确。 FusionInsight

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Storm
ZooKeeper与其他组件的关系 - MapReduce服务 MRS

ZooKeeper与其他组件的关系 ZooKeeper和HDFS的关系 ZooKeeper与HDFS的关系如图1所示。图1 ZooKeeper和HDFS的关系 ZKFC（ZKFailoverController）作为一个ZooKeeper集群的客户端，用来监控NameNode的状态信息。ZK

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ZooKeeper
HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

在HDFS长时间运行场景下，操作系统会把JVM创建的“/tmp/.java_pid*”文件定期清理。因为HDFS的内存监控使用了JVM的jinfo命令，而jinfo依赖“/tmp/.java_pid*”文件，当该文件不存在时，jinfo会执行kill -3将jstack信息打印到.out日志文件里，从而导致.out日志文件过大。

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ClickHouse消费Kafka数据异常 - MapReduce服务 MRS

10000可以根据数据中脏数据的比例进行调整。 kafka_skip_broken_messages：Kafka消息解析器对每个块的架构不兼容消息的容忍度，默认值：0。例如：kafka_skip_broken_messages = N，则引擎会跳过N条无法解析的Kafka消息。父主题：

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用ClickHouse
ALM-12076 gaussDB资源异常 - MapReduce服务 MRS

角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响如果数据库异常，所有Manager的核心业务和相关业务进程（例如告警和监控入库、查询的功能）都会受影响。可能原因数据库异常。处理步骤检查主备管理节点的数据库状态。以root用户分别登录主备管理节点，用户

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-24005 Flume传输数据异常（2.x及以前版本） - MapReduce服务 MRS

ServiceName 产生告警的服务名称。 HostName 产生告警的主机名。 ComponentType 产生告警的元素类型。 ComponentName 产生告警的元素名称。对系统的影响 Flume Channel的磁盘空间使用量有继续增长的趋势，将会使数据导入到指定目的地的时间增长，当Flume

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 5780

上一页
1
...
4
5
6
...
289
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-45647 RocksDB的Pending Compaction预估总大小持续超过阈值 - MapReduce服务 MRS

补丁基本信息说明 - MapReduce服务 MRS

ALM-45649 RocksDB的Get P95耗时持续超过阈值 - MapReduce服务 MRS

ALM-45644 RocksDB的Level0层SST文件数持续超过阈值 - MapReduce服务 MRS

执行MRS集群健康检查 - MapReduce服务 MRS

执行MRS集群节点健康检查 - MapReduce服务 MRS

ALM-45648 RocksDB持续发生Write-Stopped - MapReduce服务 MRS

ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

如何防止insert overwrite语句误操作导致数据丢失 - MapReduce服务 MRS

如何防止insert overwrite语句误操作导致数据丢失 - MapReduce服务 MRS

HBase日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

DBServer实例一直处于Restoring状态 - MapReduce服务 MRS

Storm UI查看信息时显示Internal Server Error - MapReduce服务 MRS

ZooKeeper与其他组件的关系 - MapReduce服务 MRS

HDFS日志文件过大导致OS盘空间不足 - MapReduce服务 MRS

ClickHouse消费Kafka数据异常 - MapReduce服务 MRS

ALM-12076 gaussDB资源异常 - MapReduce服务 MRS

ALM-24005 Flume传输数据异常（2.x及以前版本） - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线