检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
到当前告警值。 选择“集群 > 服务 > MemArtsCC > 配置 > 全部配置 > CCWorker(角色)”,查找“memory_limit”参数,查看当前集群上CCWorker实例的最大可用内存配置值。是否存在业务并发、数据量有长期上涨,且该告警未能自动清除。 是,执行4。
在ResourceManager(主)的WebUI界面中,单击提交的MapReduce任务,在打开的页面中查看诊断信息,根据诊断信息再采取相应的措施。 或者也可以通过查看MapReduce日志了解应用运行情况,并根据日志信息调整应用程序。 父主题: MapReduce应用开发常见问题
告警 > 告警”,选中“告警ID”为“19012”的告警,查看“告警原因”中的是否提示未知异常。 是,执行4。 否,执行2。 在FusionInsight Manager首页,选择“运维 > 备份恢复 > 备份管理”,查看任务名称为“default”的备份任务或者其他执行成功的用
创建savepoint call create_savepoint('hudi_test1', '20220908155421949'); 查看所有存在的savepoint call show_savepoints(table =>'hudi_test1'); 回滚savepoint
检查直接内存使用率。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,选中“告警ID”为“16006”的告警,查看“定位信息”中的角色名并确定实例的IP地址。 告警上报的角色是HiveServer,执行2。 告警上报的角色是MetaStore,执行3。
检查非堆内存使用率。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,选中“告警ID”为“16008”的告警,查看“定位信息”中的角色名并确定实例的IP地址。 告警上报的角色是HiveServer,执行2。 告警上报的角色是MetaStore,执行3。
运行Zookeeper客户端命令。 创建ZNode。 create /test 查看ZNode信息。 ls / 向ZNode中写入数据。 set /test "zookeeper test" 查看写入ZNode中的数据。 get /test 删除创建的ZNode。 delete
上角的下拉菜单,选择“定制 > 垃圾回收”,勾选“NameNode垃圾回收(GC)时间”。查看NameNode每分钟的垃圾回收时间统计情况。 图1 NameNode垃圾回收(GC)时间 查看NameNode每分钟的垃圾回收时间统计值是否大于告警阈值(默认12秒)。 是,执行4。 否,执行7。
登录FusionInsight Manager,具体请参见访问集群Manager。然后选择“集群 > 服务 > ZooKeeper > 实例”。 查看ZooKeeper角色实例的IP地址。 记录ZooKeeper角色实例其中任意一个的IP地址即可。 根据业务情况,准备好客户端,参考使用MRS客户端章节,登录安装客户端的节点。
DataNode节点故障。 磁盘故障。 单副本写入文件。 处理步骤 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”查看是否存在告警“ALM-14003 丢失的HDFS块数量超过阈值”。 是,执行2。 否,执行3。 按照ALM-14003 丢失的HDFS块数
Manager首页,选择“运维 > 告警 > 告警”,查看“告警ID”为“50212”的“定位信息”中的角色名并确定实例的IP地址。 选择“集群 > 服务 > Doris > 实例”,单击告警上报的FE,进入实例“图表”页面。 左侧图表分类选择“JVM”,查看FE进程的“老年代GC耗时累计值”是否大于3秒。
登录MRS管理控制台。 选择 “现有集群” ,选中需要升级Master节点规格的集群并单击集群名,进入集群信息页面。 查看集群状态,确保集群状态为“运行中”。 在“节点管理”页签查看各节点状态,确保集群所有节点的状态为“运行中”。 登录Manager,进入集群管理页面,具体请参见访问MRS集群Manager。
强制删除主机后,该主机又上电恢复,进程被重新启动。 处理步骤 登录FusionInsight Manager页面,选择“运维 > 告警 > 告警”,查看该告警的详细信息,在附加信息中查看发生该告警的主机IP。 停止上报告警的主机上的DataNode进程。 如果附加信息中发生该告警的主机IP有多个,每次只能停
检查堆内存使用率。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > OBS数据读操作接口调用成功率低于阈值”,查看“定位信息”中的角色名并确定实例的IP地址。 选择“集群 > 待操作集群的名称 > 服务 > meta > 实例 > meta(对应上报告
检查GC时间。 在FusionInsight Manager首页,单击“运维 > 告警 > 告警”,选中“告警ID”为“45337”的告警,查看“定位信息”中的实例的IP地址及角色名。 在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > 服务 >
待连接的IoTDBServer所在的节点IP地址,可通过登录FusionInsight Manage界面,选择“集群 > 服务 > IoTDB > 实例”查看。 RPC端口可通过登录FusionInsight Manager,选择“集群 > 服务 > IoTDB > 配置 > 全部配置”,搜索参
failed”的错误。 图2 log4j报错 查看log4j发现用户将“log4j.properties”文件改成了“log4g-cli.properties”(“log4j.properties”的名字是固定的不可随意修改)导致报错。 图3 查看log4j 修改后可以正常提交作业。 图4
检查GC时间。 在FusionInsight Manager首页,单击“运维 > 告警 > 告警”,选中“告警ID”为“45336”的告警,查看“定位信息”中的实例的IP地址及角色名。 在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > 服务 >
检查堆内存使用率。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > OBS元数据接口调用成功率低于阈值”,查看“定位信息”中的角色名并确定实例的IP地址。 选择“集群 > 待操作集群的名称 > 服务 > meta > 实例 > meta(对应上报告
检查堆内存使用率。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > OBS数据写操作接口调用成功率低于阈值”,查看“定位信息”中的角色名并确定实例的IP地址。 选择“集群 > 待操作集群的名称 > 服务 > meta > 实例 > meta(对应上报告