云容器引擎 CCE-自定义告警配置:CCE事件列表

时间:2023-11-01 16:25:55

CCE事件列表

事件类告警是根据CCE上报到 AOM 的事件来决定是否告警,CCE上报了一系列事件到AOM,您可以在配置事件告警的处查看具体事件,根据自身需求添加事件类告警。

图2 CCE上报的事件

CCE当前支持如下事件:

  • 扩容节点超时
  • 数据卷扩容失败
  • 主机卸载块存储失败
  • 节点池资源充足
  • 卷回收策略未知
  • 太多活跃Pod
  • 挂载数据卷失败
  • 节点kubelet故障
  • 标签选择器冲突
  • 缩容节点
  • 节点内存空间不足
  • 卷PVC丢失
  • 节点上发现未注册的网络设备
  • 数据卷回收失败
  • 未触发节点扩容
  • 删除未注册节点成功
  • 状态异常
  • 删除失败
  • 网卡未发现
  • 太多成功Pod
  • 缩容空闲节点成功
  • 未拉取镜像异常
  • 节点重启
  • 节点kube-proxy故障
  • 扩容失败
  • 节点磁盘空间已满
  • 节点任务夯住
  • 等待主机挂载块存储失败
  • 启动失败
  • 拉取镜像失败
  • 废弃节点清理
  • 副本集创建异常
  • CIDR不可用
  • 节点的连接跟踪表已满
  • 节点磁盘空间不足
  • 待机失败
  • 缩容节点失败
  • 节点不可调度
  • 节点池扩容节点失败
  • 更新配置失败
  • 节点池扩容节点成功
  • 节点纳管失败
  • 创建负载均衡失败
  • 查询失败
  • 数据卷删除失败
  • 节点操作系统内核故障
  • 扩容节点失败
  • 挂载盘符失败
  • 删除负载均衡失败
  • 修复节点池节点个数成功
  • 卸载数据卷失败
  • 激活失败
  • 节点内存不足强杀进程
  • 卸载盘符失败
  • 节点docker故障
  • 回滚失败
  • CIDR分配失败
  • 节点docker夯住
  • 标签选择器异常
  • 节点状态异常
  • 创建卷失败
  • 创建卷清理失败
  • 节点池退避重试中
  • 启动重试失败
  • 部署回滚版本未发现
  • 调度失败
  • 修复节点池节点个数失败
  • 节点文件系统只读
  • 更新失败
  • 节点ntp服务故障
  • 节点创建失败
  • 拉取镜像重试失败
  • 节点卸载失败
  • 卷误绑定
  • 查询Pod列表失败
  • 节点池资源售罄
  • 节点磁盘卸载夯住
  • 创建失败
  • 更新负载均衡失败
  • 未知Job
  • 缩容失败
  • 触发节点扩容
  • 主机挂载块存储失败
  • 重启失败
  • 节点cni插件故障
  • 节点池扩容节点启动
  • 缩容空闲节点启动
  • 删除未注册节点失败
  • 内部故障
  • 外部依赖异常
  • 初始化执行线程失败
  • 更新数据库失败
  • 节点池触发创建节点失败
  • 节点池触发删除节点失败
  • 创建包周期节点失败
  • 解除资源租户访问控制节点镜像的授权失败
  • 创建虚拟IP失败
  • 删除节点虚拟机失败
  • 删除节点安全组失败
  • 删除控制节点安全组失败
  • 删除控制节点网卡安全组失败
  • 删除集群ENI/SubENI安全组失败
  • 解绑控制节点网卡失败
  • 删除控制节点网卡失败
  • 删除控制节点虚拟机失败
  • 删除控制节点密钥对失败
  • 删除控制节点subnet失败
  • 删除控制节点VPC失败
  • 删除集群证书失败
  • 删除控制节点云服务器组失败
  • 删除虚拟IP失败
  • 获取控制节点浮动IP失败
  • 获取集群规格信息失败
  • 获取集群endpoint失败
  • 获取kubernetes集群连接失败
  • 更新集群Secret失败
  • 处理用户操作超时
  • 连接kubernetes集群超时
  • 检查组件状态失败或组件状态异常
  • 无法在kubernetes集群中找到该节点
  • 节点在kubernetes集群中状态异常
  • 无法在E CS 服务中找到该节点对应的虚拟机
  • 升级控制节点失败
  • 升级节点失败
  • 变更控制节点规格失败
  • 变更控制节点规格超时
  • 创建包周期节点校验不通过
  • 安装节点失败
  • 清理VPC中集群容器网络路由表条目失败
  • 集群状态不可用
  • 集群状态故障
  • 集群状态长时间不更新
  • 集群升级超时后更新控制节点状态失败
  • 集群升级超时后更新运行中的任务失败
  • 更新集群状态失败
  • 更新节点状态失败
  • 纳管节点超时后移除数据库中的节点记录失败
  • 节点处理超时后更新节点状态为异常失败
  • 更新集群访问地址失败
  • 删除不可用的Kubernetes连接失败
  • 同步集群证书失败
support.huaweicloud.com/usermanual-cce/cce_01_0394.html