检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
否,执行6。 升级Coordinator规格或扩容Worker节点组。 若Coordinator线程数过多,考虑升级Coordinator节点规格,提升CPU核数;若Worker线程数过多,考虑扩容Worker节点组。 查看本告警是否恢复。 是,操作结束。 否,执行6。 收集故障信息。
支持jobhistory查询失败信息接口 解决细粒度权限不生效问题 解决hive on Spark读取数据异常问题 解决Hive on mrs任务执行两次数据量增大问题 解决Hive开启矢量向量化查询有些字符串性能差问题 MRS 1.9.0.5 修复问题列表: MRS Manager MRS
否,执行6。 升级Coordinator规格或扩容Worker节点组。 若Coordinator线程数过多,考虑升级Coordinator节点规格,提升CPU核数;若Worker线程数过多,考虑扩容Worker节点组。 查看本告警是否恢复。 是,操作结束。 否,执行6。 收集故障信息。
单击“取消屏蔽”后在弹出的对话框中单击“确定”,修改告警的屏蔽状态为“显示”。 配置告警屏蔽及告警平滑次数 该操作仅适用MRS 3.5.0及之后版本集群。 MRS支持在后台配置告警屏蔽状态和平滑次数,告警产生次数小于等于平滑次数时不上报告警信息。 使用PuTTY工具,以omm用户登录主OMS节点。 执行以
record日志记录。 carbon.options.bad.records.action 指定bad record操作,例如,强制(force),重定向(redirect),失败(fail)或忽略(ignore)。有关详细信息,请参阅•Bad Records处理: carbon.options
locator分配算法的原理是,查询目前存在的所有locators,读取所有locators所分配的数据节点,并记录其使用次数。根据使用次数,对数据节点进行排序,使用次数少的排在前面,优先选择排在前面的节点。每次选择一个节点后,计数加1,并重新排序,选择后续的节点。 扩容与Colocation分配
否,执行6。 升级Coordinator规格或扩容Worker节点组。 若Coordinator线程数过多,考虑升级Coordinator节点规格,提升CPU核数;若Worker线程数过多,考虑扩容Worker节点组。 查看本告警是否恢复。 是,操作结束。 否,执行6。 收集故障信息。
ApplicationMaster的重试次数。增加重试次数可以避免当资源不足时造成AM启动失败。 适用于所有ApplicationMaster的全局设置。每个ApplicationMaster都可以使用API设置一个单独的最大尝试次数,但这个次数不能大于全局的最大次数。如果大于了,那Resou
balancer.auto.maxIdleIterations Balancer的最大连续空闲迭代次数。一次空闲迭代为没有Block块被移动的迭代,当连续空闲迭代次数达到最大连续空闲迭代次数时,本次Balancer结束。当取值为-1时,代表无穷大。 5 dfs.balancer.auto
否,执行6。 升级Coordinator规格或扩容Worker节点组。 若Coordinator线程数过多,考虑升级Coordinator节点规格,提升CPU核数;若Worker线程数过多,考虑扩容Worker节点组 查看本告警是否恢复。 是,操作结束。 否,执行6。 收集故障信息。 在FusionInsight
否,执行6。 升级Coordinator规格或扩容Worker节点组。 若Coordinator线程数过多,考虑升级Coordinator节点规格,提升CPU核数;若Worker线程数过多,考虑扩容Worker节点组。 查看本告警是否恢复。 是,操作结束。 否,执行6。 收集故障信息。
系统每60秒周期性检测Kafka各个Topic的过载情况,当检测到某个Topic在过载磁盘上的Partition数占比超出阈值(默认40%)时,产生该告警。 平滑次数为1,当某个Topic在过载磁盘上的Partition数占比低于阈值(默认40%)时,告警恢复。 过载磁盘定义:磁盘分区的IO使用率大于80%的磁盘认为是过载磁盘。
否,执行6。 升级Coordinator规格或扩容Worker节点组。 若Coordinator线程数过多,考虑升级Coordinator节点规格,提升CPU核数;若Worker线程数过多,考虑扩容Worker节点组。 查看本告警是否恢复。 是,操作结束。 否,执行6。 收集故障信息。
作业的故障恢复策略,包含以下三种,详情请参考配置FlinkServer重启策略。 fixed-delay:需配置“重试次数”和“失败重试间隔(s)”; failure-rate:需配置“最大重试次数”、“时间间隔(min)”和“失败重试间隔(s)”; none:无。 单击左上角“提交”提交作业。 新建Flink
ApplicationMaster的重试次数。增加重试次数可以避免当资源不足时造成AM启动失败。 适用于所有ApplicationMaster的全局设置。每个ApplicationMaster都可以使用API设置一个单独的最大尝试次数,但这个次数不能大于全局的最大次数。如果大于了,那Resou
locator分配算法的原理是,查询目前存在的所有locators,读取所有locators所分配的数据节点,并记录其使用次数。根据使用次数,对数据节点进行排序,使用次数少的排在前面,优先选择排在前面的节点。每次选择一个节点后,计数加1,并重新排序,选择后续的节点。 扩容与Colocation分配
locator分配算法的原理是,查询目前存在的所有locators,读取所有locators所分配的数据节点,并记录其使用次数。根据使用次数,对数据节点进行排序,使用次数少的排在前面,优先选择排在前面的节点。每次选择一个节点后,计数加1,并重新排序,选择后续的节点。 扩容与Colocation分配
locator分配算法的原理是,查询目前存在的所有locators,读取所有locators所分配的数据节点,并记录其使用次数。根据使用次数,对数据节点进行排序,使用次数少的排在前面,优先选择排在前面的节点。每次选择一个节点后,计数加1,并重新排序,选择后续的节点。 扩容与Colocation分配
locator分配算法的原理是,查询目前存在的所有locators,读取所有locators所分配的数据节点,并记录其使用次数。根据使用次数,对数据节点进行排序,使用次数少的排在前面,优先选择排在前面的节点。每次选择一个节点后,计数加1,并重新排序,选择后续的节点。 扩容与Colocation分配
解决ClickHouse数据入库慢的问题。 解决ClickHouse TTL未生效的问题。 解决ClickHouse、Zookeeper连接过多导致Hive客户端无法连接的问题。 解决ClickHouse物化视图的基表中添加列报OOM的问题。 Executor将作业老化顺序优化为根据作业结束时间老化。