正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-45287 TagSync非堆内存使用率超过阈值”,检查该告警的“定位信息”,查看告警上报的实例主机名。 在FusionInsight Manager首页,选择“集群 > 服务 > Ranger > 实例”,
检查直接内存配置。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,在实时告警列表中,单击此告警前的,在“定位信息”中查看角色名并确定实例的IP地址。 选择“集群 > 服务 > IoTDB > 实例”,单击1获取到的IP地址对应的ConfigNod
Manager首页,选择“运维 > 告警 > 告警 > ALM-45740 TokenServer进程垃圾回收(GC)时间超过阈值”,检查该告警的“定位信息”,查看告警上报的实例主机名。 在FusionInsight Manager首页,选择“集群 > 服务 > Guardian > 实例
在集群详情页,单击“组件管理”。 单击服务列表中指定的服务名称。 单击“服务配置”。 将页面右侧“基础配置”切换为“全部配置”。 图1 全部配置 在左侧导航栏定位到某个一级节点,并选择“自定义”,MRS将显示当前组件的自定义参数。 自定义参数支持服务级别与角色级别,请根据业务实际需要选择。 不支持单个角色实例添加自定义参数。
delta_commits 选填 MOR表Compaction计划触发条件。 200 compaction.async.enabled 必填 是否开启在线压缩。将compaction操作转移到sparksql运行,提升写性能。 FALSE hive_sync.enable 选填 是否向Hive同步表信息。
泄露,或配置的最大连接数不符合实际使用场景。 处理步骤 检查连接状态。 在MRS集群详情页,单击“告警管理 > 13001连接数不足 > 定位信息”。查看告警上报的节点IP地址。 获取ZooKeeper进程pid。登录到告警上报的节点,执行命令:pgrep -f proc_zookeeper。
在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,单击告警“ZooKeeper堆内存使用率超过阈值”所在行的下拉菜单,在定位信息中确认告警上报的主机名所在的节点IP地址。 在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > 服务
在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > MapReduce JobHistoryServer堆内存使用率超过阈值 > 定位信息”。查看告警上报的实例主机名。 在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > 服务 > Mapreduce
RegionServer并发数过高。 处理步骤 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,查看“告警ID”为“19024”的告警的“定位信息”中上报该告警的服务实例和主机名。 检测RegionServer的GC时间。 在FusionInsight Manager的告警列表中,查看1中的告警实例是否有“HBase
根据实际使用情况,单击“操作”列的“修改”修改并保存告警阈值。 等待2分钟,查看告警是否消失。 是,处理完毕。 否,执行4。 查看磁盘使用率是否达到上限 展开告警信息,查看“定位信息”,查看上报告警的QAS角色名称和主机名。 选择“集群 > 服务 > HetuEngine > 实例”,单击告警信息中对应的QAS角色
Manager首页,选择“运维 > 告警 > 告警 > ALM-45738 TokenServer直接内存使用率超过阈值”,检查该告警的“定位信息”,查看告警上报的实例主机名。 在FusionInsight Manager首页,选择“集群 > 服务 > Guardian > 实例
Manager首页,选择“运维 > 告警 > 告警 > ALM-45739 TokenServer非堆内存使用率超过阈值”,检查该告警的“定位信息”,查看告警上报的实例主机名。 在FusionInsight Manager首页,选择“集群 > 服务 > Guardian > 实例
检查GC时间 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,选中“ID”为“43022”的告警,查看“定位信息”中的角色名以及确认主机名所在的IP地址。 在FusionInsight Manager首页,选择“集群 > 服务 > Spark2x
GC次数 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,选中“告警ID”为“43023”的告警,查看“定位信息”中的角色名以及确认主机名所在的IP地址。 在FusionInsight Manager首页,选择“集群 > 服务 > Spark2x
Manager首页,选择“运维 > 告警 > 告警”,单击告警“ALM-13009 ZooKeeper Znode容量使用率超出阈值”所在行的下拉菜单,在定位信息中确认告警上报的Znode。 选择“集群 > 待操作集群的名称 > 服务 > ZooKeeper”,单击“资源”,在精细化监控“资源使
Manager界面,选择“运维 > 告警 > 告警 > ALM-18019 MapReduce JobHistoryServer非堆内存使用率超过阈值 > 定位信息”。查看告警上报的实例的主机名。 在FusionInsight Manager界面,选择“集群 > 待操作集群的名称 > 服务 > MapReduce
在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > Loader非堆内存使用率超过阈值”,检查该告警的“定位信息”。查看告警上报的实例主机名。 在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > 服务 > Loader
登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-24012 Flume证书文件已过期 > 定位信息”。查看告警上报的实例的IP地址。 检查系统中合法证书文件的有效期,重新生成证书文件。 以root用户登录告警所在节点主机,并执行su
在FusionInsight Manager界面,选择“运维 > 告警 > 告警 > SlapdServer CPU使用率超过阈值”,查看并记录该告警的“定位信息”中上报的主机名。 选择“集群 > 服务 > LdapServer > 实例”,单击4中的主机名对应的SlapdServer实例。 在实例界面观察“SlapdServer
主备节点网络不稳定。 备DBService异常。 备节点磁盘空间满。 主DBService节点GaussDB进程CPU使用率高(需要通过日志定位该问题)。 处理步骤 检查主备节点网络是否正常。 在FusionInsight Manager页面,选择“集群 > 服务 > DBService