检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
以集群用户登录ZooKeeper客户端,删除告警对应Znode下的无用数据。
如果集群详情页面没有“组件管理”页签,请先完成IAM用户同步(在集群详情页的“概览”页签,单击“IAM用户同步”右侧的“同步”进行IAM用户同步)。 MRS 3.x及后续版本,登录FusionInsight Manager。
使用root用户登录告警节点,执行ntpq -np命令。
执行以下命令切换用户: sudo su - root su - omm 执行status 'replication', 'source'命令查看故障节点的容灾同步状态。
重跑失败,作业报错: Caused by: org.apache.spark.SparkException: Application application_1619511926396_2586346 finished with failed status 解决方法 使用root用户登录
单击“实例”,勾选所有Hive实例,选择“更多 > 重启实例”,输入当前用户密码,单击“确定”重启所有Hive实例。 是否需要在Spark/Spark2x客户端中启用此功能? 是,重新下载并安装Spark/Spark2x客户端。 否,操作结束。 父主题: Hive企业级能力增强
登录FusionInsight Manager,选择“集群 > 服务 > LdapServer > 更多 > 重启服务”,验证当前用户身份后重启服务。 父主题: MRS集群安全加固
HiveServer或者MetaStore实例的健康状态为unknown 问题现象 HiveServer或者MetaStore实例的健康状态为unknown。 可能原因 HiveServer或者MetaStore实例被停止。
它提供对当前正在处理的记录的元数据的访问 private ProcessorContext context; private KeyValueStore<String, Integer> kvStore;
HDFS的业务访问量太大,超过了已有DataNode的负载能力。
登录ClickHouse服务异常的实例主机节点,进入当前ClickHouse实例配置目录,执行如下命令: cd ${BIGDATA_HOME}/FusionInsight_ClickHouse_版本号/x_x_ClickHouseServer/etc cat metrika.xml
启动实例,或修复实例故障,直到所有实例运行状态都是良好。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,找到本告警,根据定位信息找到故障主机。 使用omm用户登录故障主机。
选择“集群 > ClickHouse > 实例”,根据告警信息,选择对应实例,选择“图表 > 并发数”,即可查看实际的SQL并发数是否大于SQL并发阈值。 是,执行3。 否,执行5。 和用户确认业务是否在告警时间段内有大量的任务在执行。 是,执行4。 否,执行5。
执行MRS集群节点健康检查 如果某个主机节点的运行状态不是良好,用户可以执行主机健康检查,快速确认某些基本功能是否存在异常。在日常运维中,管理员也可以执行主机健康检查,以保证主机上各角色实例的配置参数以及监控没有异常、能够长时间稳定运行。
可能原因 该节点实例内存使用率过大,或配置的内存不合理。 处理步骤 在FusionInsight Manager首页,选择“运维 > 告警 > 阈值设置 > Impala > CPU和内存 > Catalog进程的内存占用率”,检查阈值大小。
选择“集群 > 待操作集群的名称 > 服务 > IoTDB > 实例”,单击告警上报的IoTDBServer,进入实例“概览”页面。单击图表区域右上角的下拉菜单,选择“定制 > 内存 > IoTDBServer直接内存使用率”,单击“确定”。
Clients:包含WebUI和JDBC接口,为用户访问提供接口。 操作流程 本实践以用户开发一个Hive数据分析应用为例,通过客户端连接Hive后,执行HQL语句访问OBS中的Hive数据。进行企业雇员信息的管理、查询。
登录MRS集群详情页面,选择“组件管理”。 单击“Loader”。 单击“实例”,显示Sqoop实例列表。 记录所有Sqoop实例的“管理IP”。 登录6.d获取的IP地址所在的主机,执行以下命令切换用户。
登录FusionInsight Manager,选择“运维 > 告警 > 告警”,选中“告警ID”为“50227”的告警,查看“定位信息”中的角色名并确定实例的IP地址。
单击“实例”,显示LoaderServer实例列表。 记录“LoaderServer(主)”行的“管理IP”。 以omm用户通过21获取的IP地址登录主LoaderServer所在的主机。