检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
件系统卡死问题 IPVS缺陷导致节点上升级CoreDNS后出现概率性解析超时 节点ARP表项超过限制 EulerOS 2.9内核缺陷导致虚拟机卡住 父主题: 节点
file-max=1048576为内核参数名称及建议取值。 若查看sysctl.conf文件时,文件中已设置fs.file-max值,可通过以下命令进行修改。 sed -i "s/fs.file-max=[0-9]*$/fs.file-max=1048576/g" /etc/sysctl.conf
”页签。 在节点列表中选择一个或多个需要重置的节点,单击“更多 > 重置节点”。 在容器引擎中选择Containerd,其余参数可根据需要进行调整,也可以和创建时保持一致。 当节点状态显示为安装中时,即表示正在重置节点。 待节点状态显示为运行中时,您即可检查节点容器运行时是否切换
target version, check and try again 请您登录CCE控制台,单击集群名称进入集群控制台,在“插件中心”处进行手动卸载,具体插件支持版本以及替换方案可查看帮助文档。 问题场景三:插件配置不满足升级条件,请在插件升级页面升级插件之后重试 升级前检查出现以下报错:
节点ID文件检查异常处理 检查项内容 检查节点的ID文件内容是否符合格式。 解决方案 在CCE控制台上的“节点管理”页面,单击异常节点名称进入ECS界面。 复制节点ID,保存到本地。 图1 复制节点ID 登录异常节点,备份文件 。 cp /var/lib/cloud/data/instance-id
x工作负载出现冲突。 前往集群控制台或执行以下kubectl命令删除集群中的test-nginx工作负载。此处仅为示例,请根据实际报错信息进行删除。 kubectl delete deploy test-nginx -n default 解决资源冲突后,尝试重新安装模板。 父主题:
X-Cluster-ID 否 String 集群 ID,使用https://Endpoint/uri这种URL格式时必须指定此参数。获取方式请参见如何获取接口URI中参数 表2 请求Body参数 参数 是否必选 参数类型 描述 apiVersion 是 String API版本,固定值v1
ReadWriteOnce两种。ReadWriteMany指以读写方式挂载到多个节点,ReadWriteOnce指以读写方式挂载到单个节点。 配置建议: 根据存储卷类型进行配置。如块存储及本地持久卷存储配置ReadWriteOnce,文件存储及对象存储配置ReadWriteMany 父主题: 存储卷声明
如果没有使用主机网络并且容器内进程不以root用户(UID为0)运行,则不涉及该漏洞。 漏洞修复方案 建议使用最小权限运行容器,对于不信任的容器进行如下限制: 禁止使用主机网络; 禁止容器内的进程以root用户运行。 相关链接 containerd-shim API exposed to
功能在 Helm V3 上有了更好的解决方案,但可能存在与原有方式不兼容的情况,需要您根据Helm V3 与 Helm V2 的差异及适配方案进行排查并做相应的适配验证。 如您短期内切换到 Helm V3 存在困难,可通过后台 Helm 客户端方式继续管理并部署 Helm V2 实例,操作方法请参见通过
3版本的OpenKruise插件时,kruise-daemon无法在使用docker容器引擎的节点上运行,请使用containerd容器引擎。 您可以选择以下方案之一进行解决: 方案一:关闭OpenKruise插件的kruise-daemon配置,然后重试集群升级。 方案二:将集群中运行时为docker的节
String 插件下载用户,无需指定 platform 是 String 插件平台,无需指定 escEndpoint 是 String ecs地址,无需指定 表3 flavor 参数 是否必选 参数类型 描述 description 否 String 插件相关的描述信息 name
能几乎一致,所以适用于对带宽、时延要求极高的业务场景,比如:线上直播、电商优惠等。 大规模组网:云原生网络2.0当前最大可支持2000个ECS节点,10万个容器。 父主题: 网络规划
在则将其去掉,并在对应的service中用"service.kubernetes.io/topology-mode"的annotation进行替换。 父主题: 升级前检查异常问题排查
failure:失败,#failure=3,表示连续3次失败后会重启容器 以上存活探针表示:容器启动后立即进行探测,如果1s内容器没有给出回应则记作探测失败。每次间隔10s进行一次探测,在探测连续失败3次后重启容器。 这些是创建时默认设置的,您也可以手动配置,如下所示。 apiVersion:
充分排查。 解决方案 检查说明 根据检查结果,检测到您的集群通过kubectl或其他应用调用了升级目标集群版本已废弃的API,您可在升级前进行整改,否则升级到目标版本后,该API将会被kube-apiserver拦截,影响您的使用。具体每个API废弃情况可参考废弃API说明。 案例介绍
关业务。 在集群中安装CCE AI套件(NVIDIA GPU),且插件的metrics API正常工作。您可以登录GPU节点,执行以下命令进行检查: curl {Pod IP}:2112/metrics 其中{Pod IP}是GPU插件的Pod IP,返回指标结果则为正常。 在集群中安装3
X-Cluster-ID 否 String 集群 ID,使用https://Endpoint/uri这种URL格式时必须指定此参数。获取方式请参见如何获取接口URI中参数 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 apiVersion String API版本,固定值v1
用curl命令等方法手动调用接口,查看结果是否符合预期。 如果容器IP+端口不能访问,建议登录到业务容器内使用“127.0.0.1+端口”进行排查。 登录容器的操作步骤请参见登录容器的方法。 访问结果是否符合预期 如果集群内可以正常访问工作负载,但访问结果不符合预期,则需要进一步
安装插件 本插件为系统默认安装,若因特殊情况卸载后,可参照如下步骤重新安装。 未安装storage-driver插件的集群,可参考如下步骤进行安装: 登录CCE控制台,单击集群名称进入集群,在左侧导航栏中选择“插件中心”,在右侧找到CCE容器存储(FlexVolume),单击“安装”。