云容器引擎 CCE-高危操作一览:集群/节点

时间:2024-05-31 08:37:35

集群/节点

表1 集群及节点高危操作

分类

高危操作

导致后果

误操作后解决方案

Master节点

修改集群内节点安全组

说明:

安全组命名规则:集群名称-cce-control-随机数

可能导致Master节点无法使用

参照新建集群的安全组进行修复,放通安全组。详情请参见集群安全组规则配置

节点到期或被销毁

该Master节点不可用

不可恢复。

重装操作系统

Master组件被删除

不可恢复。

自行升级Master或者etcd组件版本

可能导致集群无法使用

回退到原始版本。

删除或格式化节点/etc/kubernetes等核心目录数据

该Master节点不可用

不可恢复。

更改节点IP

该Master节点不可用

改回原IP。

自行修改核心组件(etcd、kube-apiserver、docker等)参数

可能导致Master节点不可用

按照推荐配置参数恢复,详情请参见集群配置管理

自行更换Master或etcd证书

可能导致集群不可用

不可恢复。

Node节点

修改集群内节点安全组

说明:

安全组命名规则:集群名称-cce-node-随机数

可能导致节点无法使用

参照新建集群的安全组进行修复,放通安全组。详情请参见集群安全组规则配置

修改节点DNS配置(/etc/resolv.conf)

导致内部 域名 无法正常访问,可能出现插件异常、节点重置升级等基本功能异常

说明:

如果业务需要使用自建DNS,可以在工作负载中配置DNS,请勿修改节点本身的 DNS地址 ,详情请参见工作负载DNS配置说明

参考新建节点中的DNS配置还原。

节点被删除

该节点不可用

不可恢复。

重装操作系统

节点组件被删除,节点不可用

重置节点,具体请参见重置节点

升级内核或容器平台依赖组件(如openvswitch/ipvlan/docker/containerd)

可能导致节点无法使用或网络异常

说明:

节点运行依赖系统内核版本,如非必要,请不要使用yum update命令更新或重装节点的操作系统内核(使用原镜像或其它镜像重装均属高危操作)

EulerOS 2.2恢复方式请参见如何解决yum update升级操作系统导致容器网络不可用问题?

非EulerOS 2.2您可以重置节点,具体请参见重置节点

更改节点IP

节点不可用

改回原IP。

自行修改核心组件(kubelet、kube-proxy等)参数

可能导致节点不可用、修改安全相关配置导致组件不安全等

按照推荐配置参数恢复,详情请参见节点池配置管理

修改操作系统配置

可能导致节点不可用

尝试还原配置项或重置节点,具体请参见重置节点

删除或修改/opt/cloud/cce、/var/paas目录,删除数据盘

节点不可用

重置节点,具体请参见重置节点

修改节点内目录权限、容器目录权限等

权限异常

不建议修改,请自行恢复。

对节点进行磁盘格式化或分区,包括系统盘、Docker盘和kubelet盘

可能导致节点不可用

重置节点,具体请参见重置节点

在节点上安装自己的其他软件

导致安装在节点上的Kubernetes组件异常,节点状态变成不可用,无法部署工作负载到此节点

卸载已安装软件,尝试恢复或重置节点,具体请参见重置节点

修改NetworkManager的配置

节点不可用

重置节点,具体请参见重置节点

删除节点上的cce-pause等系统镜像

导致无法正常创建容器,且无法拉取系统镜像

请从其他正常节点复制该镜像恢复

在E CS 侧对节点池下的节点进行规格变更

节点的规格与节点池定义的规格不一致,导致在弹性扩缩容时出现非预期现象(多扩或者少扩)

重新将节点规格变更为节点池下定义的规格,或者删除该节点重新扩容。

support.huaweicloud.com/usermanual-cce/cce_10_0054.html