云容器引擎 CCE-节点故障检测策略:自定义检查项配置

时间:2024-05-31 08:37:32

自定义检查项配置

  1. 登录CCE控制台,单击集群名称进入集群。
  2. 在左侧选择“节点管理”,切换至“节点”页签,单击“故障检测策略”
  3. 在跳转的页面中查看当前检查项配置,单击检查项操作列的“编辑”,自定义检查项配置。

    当前支持以下配置:
    • 启用/停用:自定义某个检查项的开启或关闭。
    • 目标节点配置:检查项默认运行在全部节点,用户可根据特殊场景需要自定义修改故障阈值。例如竞价实例中断回收检查只运行在竞价实例节点。

    • 触发阈值配置:默认阈值匹配常见故障场景,用户可根据特殊场景需要自定义修改故障阈值。例如调整“连接跟踪表耗尽”触发阈值由90%调整至80%。

    • 检查周期:默认检查周期为30秒,可根据用户场景需要自定义修改检查周期。

    • 故障应对策略:故障产生后,可根据用户场景自定义修改故障应对策略,当前故障应对策略如下:
      表1 故障应对策略

      故障应对策略

      效果

      提示异常

      上报Kuberentes事件。

      禁止调度

      上报Kuberentes事件,并为节点添加NoSchedule污点。

      驱逐节点负载

      上报Kuberentes事件,并为节点添加NoExecute污点。该操作会驱逐节点上的负载,可能导致业务不连续,请谨慎选择。

support.huaweicloud.com/usermanual-cce/cce_10_0659.html