检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过节点池升级存量节点的NVIDIA驱动,本质上是在重启节点的过程中重新安装驱动,因此请务必在升级驱动前确认节点上不存在正在运行的任务。 步骤一:指定节点池驱动版本 登录节点查看节点上实际的驱动,驱动版本为510.47.03。
例如: 父主题: 节点运维
按需节点转包年/包月 当前在CCE中购买节点时支持“按需计费”和“包年/包月”(按周期)两种计费方式。按需计费的购买的节点可以转成按周期计费的节点。
如果节点上的资源不足,导致节点调度不上,请扩容或者新增节点。 父主题: 调度策略
禁止重复 NULL 允许 CCE Turbo 配置自定义安全组后,原集群默认节点安全组将不会被配置至新创建节点。 更新自定义安全组对存量节点不会自动生效。 特殊局点,默认禁止安全组,仅此时允许传请求体传空自定义安全组列表。 父主题: 节点池
cat /etc/systemd/journald.conf | grep RuntimeMaxUse 创建节点/节点池时自动配置RuntimeMaxUse 您可以设置节点或节点池安装后执行脚本,在新建节点或节点池时通过脚本配置RuntimeMaxUse大小。
单击集群名称进入集群,在左侧选择“节点管理”,在右侧选择“节点池”页签。 找到扩容失败的节点池,单击节点池名称后的“更新”,在弹出的“更新节点池”页面中配置参数。 重新选择一个节点池企业项目。 配置完成后,单击“确定”。 父主题: 节点池
集群的管理规模和控制节点的数量有关系吗? 集群管理规模是指:当前集群支持管理的最大节点数。若选择50节点,表示当前集群最多可管理50个节点。 针对不同的集群规模,控制节点的规格不同,但数量不受管理规模的影响。
CCE节点NTP时间不同步如何解决? 问题现象 节点上的ntpd在长时间无法连接ntpserver等特殊场景下,可能导致偏移量过大,无法自动恢复。 问题检测 CCE节点故障检测插件(npd)中已包含节点时间同步检查项,您可以在集群中安装该插件进行检测。
约束限制: 配置为cceNodeName的节点, 其节点名称、K8S节点名称以及虚机名称相同。节点名称不支持修改, 并且在ECS侧修改了虚机名称,同步云服务器时,不会将修改后的虚机名称同步到节点。
约束限制: 配置为cceNodeName的节点, 其节点名称、K8S节点名称以及虚机名称相同。节点名称不支持修改, 并且在ECS侧修改了虚机名称,同步云服务器时,不会将修改后的虚机名称同步到节点。
Containerd节点业务容器标准输出日志写入过快导致节点数据盘使用率过高 问题现象 Containerd节点上业务容器标准输出不断写入大量日志,导致/var/lib/containerd目录占用空间不断增长,同时节点上容器创删速度变慢,进一步出现磁盘使用率过高、Pod驱逐、节点异常等现象
节点内存使用率 = 节点已使用量 / 节点可分配 = 2413824Ki / 2213604Ki = 109% 实际节点内存使用率: 实际节点内存利用率 = 节点已使用量 / 节点内存总量 = 2413824Ki / 4030180Ki = 59.9% 父主题: 节点运行
节点应按需进行加固 CCE服务的集群节点操作系统配置与开源操作系统默认配置保持一致,用户在节点创建完成后应根据自身安全诉求进行安全加固。 CCE提供以下建议的加固方法: 通过“创建节点”的“安装后执行脚本”功能,在节点创建完成后,执行命令加固节点。
CCE节点池内的节点变更规格后会有哪些影响? 问题背景 在ECS侧变更CCE节点池内节点的规格,前往CCE控制台同步云服务器状态,导致节点规格与节点池中设置的规格不一致。
节点开启缩容保护 功能介绍 该API用于节点开启缩容保护,开启缩容保护的节点无法通过修改节点池个数的方式被缩容。 调用方法 请参见如何调用API。
约束限制: 不涉及 取值范围: 空值:可用(节点池当前节点数已达到预期,且无伸缩中的节点) Synchronizing:伸缩中(节点池当前节点数未达到预期,且无伸缩中的节点) Synchronized:伸缩等待中(节点池当前节点数未达到预期,或者存在伸缩中的节点) SoldOut:
节点关闭缩容保护 功能介绍 该API用于节点关闭缩容保护,关闭缩容保护的节点可以通过修改节点池个数的方式被缩容,只允许按需节点关闭缩容保护。 调用方法 请参见如何调用API。
CCE集群中的节点无法远程登录,如何排查解决? CCE创建节点成功后,无法ssh远程登录。ssh回显提示“所选的用户密钥未在远程主机上注册”,即root用户不能直接登录到节点。
排查是否为包周期节点退订 如果该节点是否为包周期节点。 节点退订后,订单处理需要一定时间。在此期间节点将处于不可用状态,预计5~10分钟后自动清理该节点,无需做额外处理。 常见问题解决方案 节点PIDPressure 问题根因 节点上的容器占用PID过多导致节点的PID不足。