云容器引擎 CCE-CCE节点故障检测插件版本发布记录

时间:2024-09-25 08:06:20

CCE节点故障检测插件版本发布记录

表1 CCE节点故障检测插件版本记录

插件版本

支持的集群版本

更新特性

社区版本

1.19.11

v1.21

v1.23

v1.25

v1.27

v1.28

v1.29

v1.30

修复部分问题

0.8.10

1.19.8

v1.21

v1.23

v1.25

v1.27

v1.28

v1.29

v1.30

  • 兼容单系统盘
  • 支持插件实例AZ反亲和配置
  • 支持在竞价实例被释放前给节点加污点,驱逐节点上的pod
  • 插件挂载节点时区
  • 适配CCE v1.30集群

0.8.10

1.19.1

v1.21

v1.23

v1.25

v1.27

v1.28

v1.29

修复部分问题

0.8.10

1.19.0

v1.21

v1.23

v1.25

v1.27

v1.28

修复部分问题

0.8.10

1.18.48

v1.21

v1.23

v1.25

v1.27

v1.28

修复部分问题

0.8.10

1.18.46

v1.21

v1.23

v1.25

v1.27

v1.28

适配CCE v1.28版本

0.8.10

1.18.24

v1.19

v1.21

v1.23

v1.25

v1.27

修复部分问题

0.8.10

1.18.23

v1.19

v1.21

v1.23

v1.25

v1.27

修复部分问题

0.8.10

1.18.22

v1.19

v1.21

v1.23

v1.25

v1.27

-

0.8.10

1.18.21

v1.19

v1.21

v1.23

v1.25

v1.27

-

0.8.10

1.18.18

v1.19

v1.21

v1.23

v1.25

v1.27

适配CCE v1.27集群

0.8.10

1.18.14

v1.19

v1.21

v1.23

v1.25

  • 支持插件实例AZ反亲和配置
  • 支持在竞价实例被释放前给节点加污点,驱逐节点上的pod
  • 插件挂载节点时区

0.8.10

1.18.10

v1.19

v1.21

v1.23

v1.25

  • 配置界面优化
  • 优化DiskSlow检查项,支持阈值配置
  • 优化NTPProblem检查项,支持阈值配置
  • 支持插件实例AZ反亲和配置
  • 支持竞价实例中断检测,中断前驱逐节点上的pod

0.8.10

1.17.4

v1.17

v1.19

v1.21

v1.23

v1.25

优化DiskHung检查项

0.8.10

1.17.3

v1.17

v1.19

v1.21

v1.23

v1.25

  • NPC最大可打污点节点数支持百分比配置
  • 新增进程Z状态检查项ProcessZ
  • 优化NTPProblem检查项,支持检测时间偏差
  • 修复BMS节点场景存在常驻D状态进程,干扰ProcessD检查项

0.8.10

1.17.2

v1.17

v1.19

v1.21

v1.23

v1.25

  • 新增磁盘卡IO检查项DiskHung
  • 新增磁盘慢IO检查项DiskSlow
  • 新增进程D状态检查项ProcessD
  • 新增挂载点健康检查MountPointProblem
  • 避免与Service端口范围冲突,默认健康检查监听端口修改为19900,默认Prometheus指标暴露端口修改为19901。
  • 新增支持1.25集群版本

0.8.10

1.16.4

v1.17

v1.19

v1.21

v1.23

  • 新增beta检查项ScheduledEvent,支持通过metadata接口检测宿主机异常导致虚拟机进行冷热迁移事件。该检查项默认不开启。

0.8.10

1.16.3

v1.17

v1.19

v1.21

v1.23

新增ResolvConf配置文件检查。

0.8.10

1.16.1

v1.17

v1.19

v1.21

v1.23

  • 新增node-problem-controller。支持基本故障隔离能力。
  • 新增PID、FD、磁盘、内存、临时卷存储池、持久卷存储池检查项。

0.8.10

1.15.0

v1.17

v1.19

v1.21

v1.23

  • 检测项全面加固,避免误报。
  • 支持内核巡检。支持OOMKilling事件,TaskHung事件上报。

0.8.10

1.14.11

v1.17

v1.19

v1.21

适配CCE v1.21集群

0.7.1

1.14.5

v1.17

v1.19

修复监控指标无法被获取的问题

0.7.1

1.14.4

v1.17

v1.19

  • 适配ARM64节点部署
  • 适配containerd运行时节点

0.7.1

1.14.2

v1.17

v1.19

  • 适配CCE v1.19集群
  • 新增支持Ubuntu操作系统和安全容器场景

0.7.1

1.13.8

v1.15.11

v1.17

  • 修复容器隧道网络下CNI健康检查问题
  • 调整资源配额

0.7.1

1.13.6

v1.15.11

v1.17

修复僵尸进程未被回收的问题

0.7.1

1.13.5

v1.15.11

v1.17

增加污点容忍配置

0.7.1

1.13.2

v1.15.11

v1.17

增加资源限制,增强cni插件的检测能力

0.7.1

support.huaweicloud.com/bulletin-cce/cce_bulletin_0040.html