检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
BestEffort类型的Pod:系统用完了全部内存时,该类型Pod会最先被终止。 Burstable类型的Pod:系统用完了全部内存,且没有BestEffort容器可以终止时,该类型Pod会被终止。 Guaranteed类型的Pod:系统用完了全部内存、且没有Burstable与BestE
解决方案 如您的bms节点上bond0网络的mtu值非默认值1500,将出现该检查异常。 非默认参数可能导致业务丢包,请改回默认值。 父主题: 升级前检查异常问题排查
清除残留的CRD资源。 kubectl delete packageversion 10.12.1.109 上述步骤执行完成之后尝试重新检查。 父主题: 升级前检查异常问题排查
多个不同的集群中,使得计算资源无法共享,计算资源碎片数量增加。 节点规格没有跟随应用迭代而变化,资源分配率低:初期节点规格与应用规格匹配度较好,资源分配率较高;随着应用版本迭代,应用申请资源发生变化,与节点规格比例差异较大,使节点分配率降低,计算资源碎片数量增加。 业务“潮汐”特
软硬协同,计算、网络、存储全方位升级 Serverless容器,K8s生态,K8s全兼容 管理 管理集群、节点和业务 管理集群、节点和业务 集群节点全托管,聚焦业务 集群 区分规格档位,档位自主调整 区分规格档位,档位自主调整 灵活规格档位,档位自动调整 节点 多种固定规格,节点自主创删 多种固定规格,节点自主创删
管理节点池 更新节点池 更新弹性伸缩配置 修改节点池配置 纳管节点至节点池 复制节点池 同步节点池 升级操作系统 迁移节点 删除节点池 父主题: 节点池
IPVS缺陷导致节点上升级CoreDNS后出现概率性解析超时 故障现象 在集群使用IPVS转发的场景下,节点上升级CoreDNS后,可能出现概率性丢包,导致域名解析失败。 问题根因 该问题由IPVS缺陷导致,社区已在IPVS v5.9-rc1版本中修复该问题,详情请参见ipvs:
方案一:关闭OpenKruise插件的kruise-daemon配置,然后重试集群升级。 方案二:将集群中运行时为docker的节点迁移至containerd,详情请参见将节点容器引擎从Docker迁移到Containerd。 父主题: 升级前检查异常问题排查
通过节点池升级节点的GPU驱动版本 如果您使用的CUDA库无法与当前的NVIDIA驱动版本匹配,您需要升级节点的驱动版本才可以正常使用GPU节点。建议您以节点池为粒度进行节点NVIDIA驱动版本的管理,创建应用时可调度到指定驱动版本的节点池,在升级驱动时,也可以根据节点池分批次控制升级。
增强型CPU管理策略检查异常处理 检查项内容 检查当前集群版本和要升级的目标版本是否支持增强型CPU管理策略。 解决方案 问题场景:当前集群版本使用增强型CPU管理策略功能,要升级的目标集群版本不支持增强型CPU管理策略功能。 升级到支持增强型CPU管理策略的集群版本,支持增强型CPU管理策略的集群版本如下表所示:
aas用户的登录权限命令。 执行以下命令恢复paas用户权限之后重新检查: usermod -s /bin/bash paas 父主题: 升级前检查异常问题排查
自定义告警规则的名称 CoreDNS内存使用率超过百分之八十 描述(可选) 添加告警规则描述。 检查CoreDNS容器内存使用率是否大于80%。 告警规则(PromQL) 输入普罗查询语句。关于如何编写普罗查询语句,请参见查询示例。 本例中设置CoreDNS当内存使用率的最大值大于80%产生告警,示例如下:
v1.0.2-v1.0.7 v1.1.1-v1.1.5 解决方案 检测到当前everest版本存在兼容性限制,无法随集群升级,请联系技术支持人员。 父主题: 升级前检查异常问题排查
志中体现,请您充分排查。 解决方案 检查说明 根据检查结果,检测到您的集群通过kubectl或其他应用调用了升级目标集群版本已废弃的API,您可在升级前进行整改,否则升级到目标版本后,该API将会被kube-apiserver拦截,影响您的使用。具体每个API废弃情况可参考废弃API说明。
as的文件数据。 当前集群升级流程会将/var/paas路径下的文件的属主和属组均重置为paas。 请您参考下述命令排查当前业务Pod中是否将文件数据存储在/var/paas路径下,修改避免使用该路径,并移除该路径下的异常文件后重试检查,通过后可继续升级。 find /var/paas
导致如下影响: 延迟增加:CoreDNS需要处理更多的请求,可能会导致DNS查询变慢,从而影响业务性能。 资源占用率增加:为保证DNS性能,CoreDNS往往需要更高规格的配置。 解决方案 NodeLocal DNSCache可以提升服务发现的稳定性和性能。 关于NodeLocal
chronyd命令后重新查询状态。 以下为正常回显: 图2 chronyd运行状态 若重启chronyd服务无法解决该问题,请联系技术支持人员。 父主题: 升级前检查异常问题排查
如需了解更多信息,请参见iptables与IPVS如何选择。 节点规格 使用云容器引擎时,集群节点最小规格要求为CPU ≥ 2核且内存 ≥ 4GB,但使用很多小规格ECS并非是最优选择,需要根据业务需求合理评估。使用过多的小规格节点会存在以下弊端: 小规格节点的网络资源的上限较小,可能存在单点瓶颈。
个IP地址,会占用容器网络的IP。 主机网络:Pod直接使用宿主机的网络,即在Pod中配置hostNetwork: true参数,详情请参见在Pod中配置主机网络(hostNetwork)。配置完成后的Pod会占用宿主机的端口,Pod的IP就是宿主机的IP,不会占用容器网络的IP
object 插件规格参数 custom 是 表3 object 插件自定义参数 表2 flavor 参数 是否必选 参数类型 描述 name 是 String 插件规格名称,固定为:default resources 是 resources object 容器资源(CPU、内存)配额。 表3