检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如果当前集群已启用Kerberos认证,需先配置客户端认证,可参考5。如果当前集群未启用Kerberos认证,则无需执行该步骤。 参考表1运行相关命令。 表1 Flink Shell命令参考 命令 参数说明 描述 yarn-session.sh -at,--applicationType
“服务状态”页签单击“更多”,选择“重启服务”或“滚动重启服务”。 升级路径不一样重启的组件不一样,详见表1。 如果是跨补丁版本升级,需要重启的组件为各版本重启组件的合集。 表1 重启组件 集群当前补丁版本 目标补丁版本 重启的组件 MRS 3.3.0-LTS.1 MRS 3.3
日志 > 下载”。 在“服务”中勾选待操作集群的“DBService”和OMS下的“OS”、“OS Statistics”、“OS Performance”,单击“确定”。 单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。 请联系运维人员,并发送已收集的故障日志信息。
0-LTS及之后的版本中,Spark2x服务改名为Spark,服务包含的角色名也有差异,例如JDBCServer2x变更为JDBCServer。相关涉及服务名称、角色名称的描述和操作请以实际版本为准。 告警属性 告警ID 告警级别 是否自动清除 43017 重要 是 告警参数 参数名称 参数含义 来源 产生告警的集群名称。
产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 附加信息 Task Failure Rate 产生告警的计算实例租户名和当前超过阈值的大小。 对系统的影响 HetuEngine计算实例任务失败率过高,会影响业务的正常运行,需及时排查问题并处理。 可能原因 计算实例资源配置过小。
String 参数解释: 可用区范围。 约束限制: 不涉及 取值范围: Center:表示作用域为中心。 Edge:表示作用域为边缘。 默认取值: 不涉及 请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 available_zones Array
Manager对ClickHouse进行集群操作,无法使用ClickHouse服务功能。 可能原因 ClickHouse在使用过程中,如表创建、插入或删除表数据等操作时,ClickHouse会在ZooKeeper的节点中创建znode,随着业务量的增加该znode实际数量可能会超过配置的阈值。
> Impalad Web UI”,单击任一个节点进入Web UI页面。 在Web UI页面,单击“/backends”,查看Impala列表,找到告警上报的实例,单击“Web UI”,进入亚健康节点的Web UI后,单击“/queries”,查看任务执行情况,是否存在执行缓慢的任务。
Manager首页,选择“集群 > 待操作集群的名称 > 服务 > Presto > 实例”,单击告警上报的Coordinator,进入“实例状态”页面,单击图表区域右上角的下拉菜单,选择“定制 > 集群状态”,勾选“Presto进程GC时间” ,单击“确定”,查看GC时间是否大于5秒。 是,执行3。
Manager首页,选择“集群 > 待操作集群的名称 > 服务 > Presto > 实例”,单击告警上报的Worker,进入“实例状态”页面,单击图表区域右上角的下拉菜单,选择“定制 > 集群状态”,勾选“Presto进程GC时间” ,单击“确定”,查看GC时间是否大于5秒。 是,执行3。
等待两分钟,在告警列表中查看该告警是否清除。 是,处理完毕。 否,执行5。 收集故障信息。 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。 在“服务”中勾选“Doris”,单击“确定”。 单击右上角的时间编辑按钮,设置日志收集的“开始时间”和“结束时间
定实例的IP地址。 选择“集群 > 待操作集群的名称 > 服务 > meta > 实例 > meta(对应上报告警实例IP地址)”。单击图表区域右上角的下拉菜单,选择“定制”,在“OBS元数据操作”中勾选“OBS接口调用平均时间”,单击“确定”,查看OBS元数据接口调用平均时间,确定是否有接口调用时间超过阈值。
定实例的IP地址。 选择“集群 > 待操作集群的名称 > 服务 > meta > 实例 > meta(对应上报告警实例IP地址)”。单击图表区域右上角的下拉菜单,选择“定制”,在“OBS元数据操作”中勾选“OBS接口调用成功率”,单击“确定”,查看OBS元数据接口调用成功率,确定是否有接口调用成功率低于阈值。
定实例的IP地址。 选择“集群 > 待操作集群的名称 > 服务 > meta > 实例 > meta(对应上报告警实例IP地址)”。单击图表区域右上角的下拉菜单,选择“定制”,在“OBS数据写操作”中勾选“OBS数据写操作接口调用成功率”,单击“确定”,查看OBS数据写操作接口调
keytab=<path_to_keytab> 其中<principal_name>表示用户使用的Kerberos用户的principal,如“test@<系统域名>”。<path_to_keytab>表示<principal_name>对应的keytab文件路径,如“/opt/auth/test/user
IoTDBServer实例节点的业务ip -p IoTDBServer RPC端口 -f example-filename.csv 需根据提示交互式输入业务用户名和对应密码,如下显示表示CSV文件导入成功: 验证数据一致性。 执行以下命令,切换到IoTDB客户端运行脚本所在目录。 cd /opt/client/IoTDB/iotdb/sbin
0-LTS及之后的版本中,Spark2x服务改名为Spark,服务包含的角色名也有差异,例如JDBCServer2x变更为JDBCServer。相关涉及服务名称、角色名称的描述和操作请以实际版本为准。 告警属性 告警ID 告警级别 是否自动清除 43013 重要 是 告警参数 参数名称 参数含义 来源 产生告警的集群名称。
Manager(MRS 3.x及之后版本)。 选择“集群 > 待操作集群的名称 > 服务 > Hive > HiveServer”。 在HiveServer列表里选择设置租约隔离的HiveServer,选择“HiveServer > 实例配置 > 全部配置”。 在“全部配置”界面的右上角搜索“hive
否,重启RangerAdmin故障实例或Ranger服务,执行4。 重启服务期间服务不可用,业务中断。重启实例期间实例不可用,当前实例节点任务会执行失败。 在告警列表中查看“Ranger服务不可用”告警是否清除。 是,处理完毕。 否,执行5。 收集故障信息。 在FusionInsight Manager界面,选择“运维
定实例的IP地址。 选择“集群 > 待操作集群的名称 > 服务 > meta > 实例 > meta(对应上报告警实例IP地址)”。单击图表区域右上角的下拉菜单,选择“定制”,在“OBS数据读操作”中勾选“OBS数据读操作接口调用成功率”,单击“确定”,查看OBS数据读操作接口调