云容器引擎 CCE-高危操作及解决方案:集群/节点

时间:2023-11-01 16:25:54

集群/节点

表1 集群及节点高危操作

分类

高危操作

导致后果

误操作后解决方案

master节点

修改集群内节点安全组

可能导致master节点无法使用

说明:

命名规则:集群名称-cce-control-随机数

参照新建集群的安全组进行修复,放通安全组。

节点到期或被销毁

该master节点不可用

不可恢复。

重装操作系统

master组件被删除

不可恢复。

自行升级master或者etcd组件版本

可能导致集群无法使用

回退到原始版本。

删除或格式化节点/etc/kubernetes等核心目录数据

该master节点不可用

不可恢复。

更改节点IP

该master节点不可用

改回原IP。

自行修改核心组件(etcd、kube-apiserver、docker等)参数

可能导致master节点不可用

按照推荐配置参数恢复,详情请参见配置管理

自行更换master或etcd证书

可能导致集群不可用

不可恢复。

worker节点

修改集群内节点安全组

可能导致节点无法使用

说明:

命名规则:集群名称-cce-node-随机数

参照新建集群的安全组进行修复,放通安全组。

节点被删除

该节点不可用

不可恢复。

重装操作系统

节点组件被删除,节点不可用

重置节点,具体请参见重置节点

升级节点内核

可能导致节点无法使用或网络异常

说明:

节点运行依赖系统内核版本,如非必要,请不要使用yum update更新或重装节点的操作系统内核(使用原镜像或其它镜像重装均属高危操作)

重置节点,具体请参见重置节点

更改节点IP

节点不可用

改回原IP。

自行修改核心组件(kubelet、kube-proxy等)参数

可能导致节点不可用、修改安全相关配置导致组件不安全等

按照推荐配置参数恢复,详情请参见配置管理

修改操作系统配置

可能导致节点不可用

尝试还原配置项或重置节点,具体请参见重置节点

删除/opt、/var/paas目录,删除数据盘

节点不可用

重置节点,具体请参见重置节点

修改节点内目录权限、容器目录权限等

权限异常

不建议修改,请自行恢复。

对节点进行磁盘格式化或分区

节点不可用

重置节点,具体请参见重置节点

在节点上安装自己的其他软件

导致安装在节点上的Kubernetes组件异常,节点状态变成不可用,无法部署工作负载到此节点

卸载已安装软件,尝试恢复或重置节点,具体请参见重置节点

support.huaweicloud.com/usermanual-cce/cce_01_0054.html