云服务器内容精选

华为云首页用户手册

升级集群

云容器引擎 CCE_AUTOPILOT集群-升级前须知:注意事项

注意事项升级集群前，您需要知晓以下事项：请务必慎重并选择合适的时间段进行升级，以减少升级对您的业务带来的影响。集群升级前，请参考Kubernetes版本发布记录了解每个集群版本发布的特性以及差异，否则可能因为应用不兼容新集群版本而导致升级后异常。例如，您需要检查集群中是否使用了目标版本废弃的API，否则可能导致升级后调用接口失败。集群升级时，以下几点注意事项可能会对您的业务存在影响，请您关注：集群升级前，请确认集群中未执行高危操作，否则可能导致集群升级失败或升级后配置丢失。例如，常见的高危操作有通过ELB控制台修改CCE管理的监听器配置等。建议您通过CCE控制台修改相关配置，以便在升级时自动继承。

云容器引擎 CCE_AUTOPILOT集群升级集群
云容器引擎 CCE-升级概述:升级方式

升级方式表1 升级方式介绍升级方式介绍升级范围优点约束原地升级节点上升级Kubernetes组件、网络组件和CCE管理组件，升级过程中业务Pod和网络均不受影响。升级过程中，节点分批进行升级，存量节点将不可调度，升级完成的批次支持调度新业务。节点操作系统不升级插件在目标版本集群不兼容时自动升级 K8s组件自动升级可一键式升级，用户无需迁移业务，可以基本上保证业务不断。原地升级仅在v1.15及以上版本集群支持。迁移将老版本集群的业务迁移到新版本集群，适用于需要大幅度跨版本集群升级的需求。集群内资源均重新部署。可避免老版本连续升级导致的版本不兼容问题。 -

云容器引擎 CCE 升级集群
云容器引擎 CCE-升级概述:集群升级流程

集群升级流程集群升级流程包括升级前检查、备份、升级和升级后验证几个步骤，下面介绍集群升级过程中的相关流程。图1 集群升级流程在确定集群的目标版本后，请您仔细阅读升级注意事项，避免升级时出现功能不兼容的问题。升级前检查升级集群前，CCE会对您的集群进行必要的检查，包括集群状态、插件状态、节点状态、工作负载兼容性等多方面进行检查，确保集群满足升级的条件，检查项目请参考升级前检查项。如果出现检查异常项，请参考控制台中的提示进行修复。备份通过硬盘快照的方式帮您备份集群控制节点，以保存CCE组件镜像、组件配置、Etcd数据等关键数据。建议您在升级前进行备份。如果在升级过程中出现不可预期的情况，可以基于备份为您快速恢复集群。备份方式备份对象备份方式备份时间回滚时间说明 etcd数据备份 etcd数据升级流程中自动备份 1-5min 2h 必选备份，升级过程中自动进行，用户无需关注 CBR整机备份 Master节点磁盘，包括组件镜像、配置、日志以及etcd数据通过页面一键备份（手动触发） 20min-2h（受当前区域云备份任务排队情况影响） 20min 该功能逐步由EVS快照备份替代 EVS快照备份 Master节点磁盘，包括组件镜像、配置、日志以及etcd数据通过页面一键备份（手动触发） 1-5min 20min 该功能上线中对于已上线的区域，EVS快照备份将替代CBR整机备份配置与升级执行升级前，需要对升级参数进行配置，我们已为您提供了默认配置，您也可以根据需要进行配置，升级参数配置完成后，将进入正式升级流程，对插件、控制节点、用户节点依次进行升级。插件升级配置：此处列出了您的集群中已安装的插件。在集群升级过程中系统会自动升级已选择的插件，以兼容升级后的集群版本，您可以单击插件右侧的“配置”重新定义插件参数。插件右侧如有标记，表示当前插件不能同时兼容集群升级起始和目标版本，在集群版本升级完成后将为您升级该插件，该插件在集群升级过程中可能无法正常使用。节点升级配置每批最大升级节点数：您可以设置每批升级的最大节点数量。升级时节点池之间会依次进行升级。节点池内的节点分批升级，第一批升级1个节点，第二批升级2个节点，后续每批升级节点数以2的幂数增加，直到达到您设置的每批最大升级节点数，并会持续作用在下一个节点池中。默认每批最大升级节点数为20，最高可配置为60。节点优先级配置：您可以自行定义节点升级的优先级顺序。如不设置该优先级，系统将根据默认策略生成优先级顺序执行升级。添加节点池优先级：自定义节点池升级的优先级顺序。如不设置，默认策略为节点数量少的节点池优先升级。添加节点优先级：自定义节点池内节点升级的优先级顺序。如不设置，默认策略为负载较轻(根据节点Pod数量、节点资源请求率、节点PV数量等维度计算负载情况)的节点优先升级。升级后验证升级完成后，会自动为集群执行集群状态检查、节点状态检查等，您需要手动进行业务验证、新建节点验证、新建Pod验证等，确保升级后集群功能正常。详情请参见升级后验证。

云容器引擎 CCE 升级集群
云容器引擎 CCE-手动升级:操作步骤

操作步骤集群升级步骤包括：升级前检查、备份、配置与升级、升级后处理。登录CCE控制台，单击集群名称进入集群。在左侧导航栏选择“集群升级”。根据当前集群版本，系统将为您生成最佳升级路径，您可以在该路径中选择需要升级的版本，确认集群版本差异、插件版本等信息，然后单击“前往升级”。进行升级前检查，单击“开始检查”并确认。如集群中存在异常项或风险项，请根据页面提示的检查结果进行处理，处理完成后需重新进行升级前检查。异常项：请查看页面提示的解决方案并处理异常后，重新进行升级前检查。风险项：表示该结果可能会影响集群升级结果，请您查看风险说明并确认您是否处于风险影响范围。如确认无风险，可单击该风险项后的“确认”按钮，手动跳过该风险项，然后重新进行升级前检查。待升级前检查通过后，单击“下一步”。进行集群备份。集群升级过程中将自动进行etcd数据备份，您可手动进行Master节点备份，以加快Master节点升级失败时的回滚速度，如无需手动备份可直接单击“下一步”。备份方式备份对象备份方式备份时间回滚时间说明 etcd数据备份 etcd数据升级流程中自动备份 1-5min 2h 必选备份，升级过程中自动进行，用户无需关注 EVS快照备份 Master节点磁盘，包括组件镜像、配置、日志以及etcd数据通过页面一键备份（手动触发） 1-5min 20min - 配置升级参数。插件升级配置：此处列出了您的集群中已安装的插件。在集群升级过程中系统会自动升级已选择的插件，以兼容升级后的集群版本，您可以单击插件右侧的“配置”重新定义插件参数。插件右侧如有标记，表示当前插件不能同时兼容集群升级起始和目标版本，在集群版本升级完成后将为您升级该插件，该插件在集群升级过程中可能无法正常使用。配置完成后，单击“立即升级”按钮，并确认升级操作后集群开始升级。您可以在页面下方查看版本升级的进程。若在集群升级过程中出现升级失败的提示，请参照提示信息修复问题后重试。升级完成后，单击“下一步”，请根据页面提示的检查项进行升级后验证。确认所有检查项均正常后，可单击“完成”按钮，并确认完成升级后检查，详情请参见升级后验证。您可以在集群列表页面查看集群当前的Kubernetes版本，确认升级成功。

云容器引擎 CCE 升级集群
云容器引擎 CCE-升级前须知:升级备份说明

升级备份说明目前集群升级备份方式如下：备份方式备份对象备份方式备份时间回滚时间说明 etcd数据备份 etcd数据升级流程中自动备份 1-5min 2h 必选备份，升级过程中自动进行，用户无需关注 CBR整机备份 Master节点磁盘，包括组件镜像、配置、日志以及etcd数据通过页面一键备份（手动触发） 20min-2h（受当前区域云备份任务排队情况影响） 20min 该功能逐步由EVS快照备份替代 EVS快照备份 Master节点磁盘，包括组件镜像、配置、日志以及etcd数据通过页面一键备份（手动触发） 1-5min 20min 该功能上线中对于已上线的区域，EVS快照备份将替代CBR整机备份

云容器引擎 CCE 升级集群
云容器引擎 CCE-升级前须知:废弃API说明

废弃API说明随着Kubernetes API的演化，API会周期性地被重组或升级，部分API会被弃用并被最终删除。以下为各Kubernetes社区版本中被废弃的API，更多已废弃的API说明请参见已弃用 API 的迁移指南。 Kubernetes社区v1.27版本中废弃的API Kubernetes社区v1.25版本中废弃的API Kubernetes社区v1.22版本中废弃的API Kubernetes社区v1.16版本中废弃的API 当某API被废弃时，已经创建的资源对象不受影响，但新建或编辑该资源时将出现API版本被拦截的情况。表2 Kubernetes社区v1.27版本中废弃的API 资源名称废弃API版本替代API版本变更说明 CS IStorageCapacity storage.k8s.io/v1beta1 storage.k8s.io/v1 （该API从社区v1.24版本开始可用） - FlowSchema 和 PriorityLevelConfiguration flowcontrol.apiserver.k8s.io/v1beta1 flowcontrol.apiserver.k8s.io/v1beta3 （该API从社区v1.26版本开始可用） - HorizontalPodAutoscaler autoscaling/v2beta2 autoscaling/v2 （该API从社区v1.23版本开始可用） - 表3 Kubernetes社区v1.25版本中废弃的API 资源名称废弃API版本替代API版本变更说明 CronJob batch/v1beta1 batch/v1 （该API从社区v1.21版本开始可用） - EndpointSlice discovery.k8s.io/v1beta1 discovery.k8s.io/v1 （该API从社区v1.21版本开始可用）此次更新需注意以下变更：每个Endpoint中，topology["kubernetes.io/hostname"]字段已被弃用，请使用nodeName字段代替。每个Endpoint中，topology["kubernetes.io/zone"]字段已被弃用，请使用zone字段代替。 topology字段被替换为deprecatedTopology，并且在 v1 版本中不可写入。 Event events.k8s.io/v1beta1 events.k8s.io/v1 （该API从社区v1.19版本开始可用）此次更新需注意以下变更： type 字段只能设置为 Normal 和 Warning 之一。 involvedObject 字段被更名为 regarding。 action、reason、reportingController 和 reportingInstance 字段在创建新的 events.k8s.io/v1 版本 Event 时都是必需的字段。使用 eventTime 而不是已被弃用的 firstTimestamp 字段（该字段已被更名为 deprecatedFirstTimestamp，且不允许出现在新的 events.k8s.io/v1 Event 对象中）。使用 series.lastObservedTime 而不是已被弃用的 lastTimestamp 字段（该字段已被更名为 deprecatedLastTimestamp，且不允许出现在新的 events.k8s.io/v1 Event 对象中）。使用 series.count 而不是已被弃用的 count 字段（该字段已被更名为 deprecatedCount，且不允许出现在新的 events.k8s.io/v1 Event 对象中）。使用 reportingController 而不是已被弃用的 source.component 字段（该字段已被更名为 deprecatedSource.component，且不允许出现在新的 events.k8s.io/v1 Event 对象中）。使用 reportingInstance 而不是已被弃用的 source.host 字段（该字段已被更名为 deprecatedSource.host，且不允许出现在新的 events.k8s.io/v1 Event 对象中）。 HorizontalPodAutoscaler autoscaling/v2beta1 autoscaling/v2 （该API从社区v1.23版本开始可用） - PodDisruptionBudget policy/v1beta1 policy/v1 （该API从社区v1.21版本开始可用）在 policy/v1 版本的 PodDisruptionBudget 中将 spec.selector 设置为空（{}）时会选择名字空间中的所有 Pod（在 policy/v1beta1 版本中，空的 spec.selector 不会选择任何 Pod）。如果 spec.selector 未设置，则在两个 API 版本下都不会选择任何 Pod。 PodSecurityPolicy policy/v1beta1 - 从社区v1.25版本开始，PodSecurityPolicy资源不再提供policy/v1beta1版本的API，并且PodSecurityPolicy准入控制器也会被删除。请使用Pod Security Admission配置替代。 RuntimeClass node.k8s.io/v1beta1 node.k8s.io/v1（该API从社区v1.20版本开始可用） - 表4 Kubernetes社区v1.22版本中废弃的API 资源名称废弃API版本替代API版本变更说明 MutatingWebhookConfiguration ValidatingWebhookConfiguration admissionregistration.k8s.io/v1beta1 admissionregistration.k8s.io/v1 （该API从社区v1.16版本开始可用） webhooks[*].failurePolicy 在 v1 版本中默认值从 Ignore 改为 Fail。 webhooks[*].matchPolicy 在 v1 版本中默认值从 Exact 改为 Equivalent。 webhooks[*].timeoutSeconds 在 v1 版本中默认值从 30s 改为 10s。 webhooks[*].sideEffects 的默认值被删除，并且该字段变为必须指定；在 v1 版本中可选的值只能是 None 和 NoneOnDryRun 之一。 webhooks[*].admissionReviewVersions 的默认值被删除，在 v1 版本中此字段变为必须指定（AdmissionReview 的被支持版本包括 v1 和 v1beta1）。 webhooks[*].name 必须在通过 admissionregistration.k8s.io/v1 创建的对象列表中唯一。 CustomResourceDefinition apiextensions.k8s.io/v1beta1 apiextensions/v1 （该API从社区v1.16版本开始可用） spec.scope 的默认值不再是 Namespaced，该字段必须显式指定。 spec.version 在 v1 版本中被删除，应改用 spec.versions。 spec.validation 在 v1 版本中被删除，应改用 spec.versions[*].schema。 spec.subresources 在 v1 版本中被删除，应改用 spec.versions[*].subresources。 spec.additionalPrinterColumns 在 v1 版本中被删除，应改用 spec.versions[*].additionalPrinterColumns。 spec.conversion.webhookClientConfig 在 v1 版本中被移动到 spec.conversion.webhook.clientConfig 中。 spec.conversion.conversionReviewVersions 在 v1 版本中被移动到 spec.conversion.webhook.conversionReviewVersions spec.versions[*].schema.openAPIV3Schema 在创建 v1 版本的 CustomResourceDefinition 对象时变成必需字段，并且其取值必须是一个结构化的 Schema。 spec.preserveUnknownFields: true 在创建 v1 版本的 CustomResourceDefinition 对象时不允许指定；该配置必须在 Schema 定义中使用 x-kubernetes-preserve-unknown-fields: true 来设置。在 v1 版本中，additionalPrinterColumns 的条目中的 JSONPath 字段被更名为 jsonPath（补丁 #66531）。 APIService apiregistration/v1beta1 apiregistration.k8s.io/v1 （该API从社区v1.10版本开始可用） - TokenReview authentication.k8s.io/v1beta1 authentication.k8s.io/v1 （该API从社区v1.6版本开始可用） - LocalSubjectAccessReview SelfSubjectAccessReview SubjectAccessReview SelfSubjectRulesReview authorization.k8s.io/v1beta1 authorization.k8s.io/v1 （该API从社区v1.16版本开始可用） spec.group 在 v1 版本中被更名为 spec.groups（补丁 #32709） CertificateSigningRequest certificates.k8s.io/v1beta1 certificates.k8s.io/v1 （该API从社区v1.19版本开始可用） certificates.k8s.io/v1 中需要额外注意的变更：对于请求证书的 API 客户端而言： spec.signerName 现在变成必需字段（参阅已知的 Kubernetes 签署者），并且通过 certificates.k8s.io/v1 API 不可以创建签署者为 kubernetes.io/legacy-unknown 的请求。 spec.usages 现在变成必需字段，其中不可以包含重复的字符串值，并且只能包含已知的用法字符串。对于要批准或者签署证书的 API 客户端而言： status.conditions 中不可以包含重复的类型。 status.conditions[*].status 字段现在变为必需字段。 status.certificate 必须是 PEM 编码的，而且其中只能包含 CERTIFICATE 数据块。 Lease coordination.k8s.io/v1beta1 coordination.k8s.io/v1 （该API从社区v1.14版本开始可用） - Ingress networking.k8s.io/v1beta1 extensions/v1beta1 networking.k8s.io/v1 （该API从社区v1.19版本开始可用） spec.backend 字段被更名为 spec.defaultBackend。后端的 serviceName 字段被更名为 service.name。数值表示的后端 servicePort 字段被更名为 service.port.number。字符串表示的后端 servicePort 字段被更名为 service.port.name。对所有要指定的路径，pathType 都成为必需字段。可选项为 Prefix、Exact 和 ImplementationSpecific。要匹配 v1beta1 版本中未定义路径类型时的行为，可使用 ImplementationSpecific。 IngressClass networking.k8s.io/v1beta1 networking.k8s.io/v1 （该API从社区v1.19版本开始可用） - ClusterRole ClusterRoleBinding Role RoleBinding rbac.authorization.k8s.io/v1beta1 rbac.authorization.k8s.io/v1 （该API从社区v1.8版本开始可用） - PriorityClass scheduling.k8s.io/v1beta1 scheduling.k8s.io/v1 （该API从社区v1.14版本开始可用） - CSIDriver CSINode StorageClass VolumeAttachment storage.k8s.io/v1beta1 storage.k8s.io/v1 CSIDriver从社区v1.19版本开始在storage.k8s.io/v1中提供。 CSINode从社区v1.17版本开始在storage.k8s.io/v1中提供。 StorageClass从社区v1.6 版本开始在storage.k8s.io/v1中提供。 VolumeAttachment从社区v1.13版本开始在storage.k8s.io/v1中提供。表5 Kubernetes社区v1.16版本中废弃的API 资源名称废弃API版本替代API版本变更说明 NetworkPolicy extensions/v1beta1 networking.k8s.io/v1 （该API从社区v1.8版本开始可用） - DaemonSet extensions/v1beta1 apps/v1beta2 apps/v1 （该API从社区v1.9版本开始可用） spec.templateGeneration 字段被删除。 spec.selector 现在变成必需字段，并且在对象创建之后不可变更；可以将现有模板的标签作为选择算符以实现无缝迁移。 spec.updateStrategy.type 的默认值变为 RollingUpdate （extensions/v1beta1 API 版本中的默认值是 OnDelete）。 Deployment extensions/v1beta1 apps/v1beta1 apps/v1beta2 apps/v1 （该API从社区v1.9版本开始可用） spec.rollbackTo 字段被删除。 spec.selector 字段现在变为必需字段，并且在 Deployment 创建之后不可变更；可以使用现有的模板的标签作为选择算符以实现无缝迁移。 spec.progressDeadlineSeconds 的默认值变为 600 秒（extensions/v1beta1 中的默认值是没有期限）。 spec.revisionHistoryLimit 的默认值变为 10 （apps/v1beta1 API 版本中此字段默认值为 2，在extensions/v1beta1 API 版本中的默认行为是保留所有历史记录）。 maxSurge 和 maxUnavailable 的默认值变为 25% （在 extensions/v1beta1 API 版本中，这些字段的默认值是 1）。 StatefulSet apps/v1beta1 apps/v1beta2 apps/v1 （该API从社区v1.9版本开始可用） spec.selector 字段现在变为必需字段，并且在 StatefulSet 创建之后不可变更；可以使用现有的模板的标签作为选择算符以实现无缝迁移。 spec.updateStrategy.type 的默认值变为 RollingUpdate （apps/v1beta1 API 版本中的默认值是 OnDelete）。 ReplicaSet extensions/v1beta1 apps/v1beta1 apps/v1beta2 apps/v1 （该API从社区v1.9版本开始可用） spec.selector 现在变成必需字段，并且在对象创建之后不可变更；可以将现有模板的标签作为选择算符以实现无缝迁移。 PodSecurityPolicy extensions/v1beta1 policy/v1beta1 （该API从社区v1.10版本开始可用） policy/v1beta1 API 版本的 PodSecurityPolicy 会在 v1.25 版本中移除。

云容器引擎 CCE 升级集群
云容器引擎 CCE-升级前须知:注意事项

注意事项升级集群前，您需要知晓以下事项：请务必慎重并选择合适的时间段进行升级，以减少升级对您的业务带来的影响。集群升级前，请参考Kubernetes版本发布说明了解每个集群版本发布的特性以及差异，否则可能因为应用不兼容新集群版本而导致升级后异常。例如，您需要检查集群中是否使用了目标版本废弃的API，否则可能导致升级后调用接口失败，详情请参见废弃API说明。集群升级时，以下几点注意事项可能会对您的业务存在影响，请您关注：集群升级过程中，不建议对集群进行任何操作。尤其是，请勿关机、重启或删除节点，否则会导致升级失败。集群升级前，请确认集群中未执行高危操作，否则可能导致集群升级失败或升级后配置丢失。例如，常见的高危操作有本地修改集群节点的配置、通过ELB控制台修改CCE管理的监听器配置等。建议您通过CCE控制台修改相关配置，以便在升级时自动继承。集群升级过程中，已运行工作负载业务不会中断，但API Server访问会短暂中断，如果业务需要访问API Server可能会受到影响。集群升级过程中默认不限制应用调度。但下列旧版本集群升级过程中，仍然会给节点打上“node.kubernetes.io/upgrade”（效果为“NoSchedule”）的污点，并在集群升级完成后移除该污点。所有v1.15集群所有v1.17集群补丁版本小于等于v1.19.16-r4的1.19集群补丁版本小于等于v1.21.7-r0的1.21集群补丁版本小于等于v1.23.5-r0的1.23集群

云容器引擎 CCE 升级集群
云容器引擎 CCE-升级前须知:版本差异说明

版本差异说明版本升级路径版本差异建议自检措施 v1.23/v1.25 升级至v1.27 容器运行时Docker不再被推荐使用，建议您使用Containerd进行替换，详情请参见容器引擎。已纳入升级前检查。 v1.23升级至v1.25 在Kubernetes v1.25版本中， PodSecurityPolicy已被移除，并提供Pod安全性准入控制器（Pod Security Admission配置）作为PodSecurityPolicy的替代。如果您需要将PodSecurityPolicy的相关能力迁移到Pod Security Admission中，需要参照以下步骤进行：确认集群为CCE v1.23的最新版本。迁移PodSecurityPolicy的相关能力迁移到Pod Security Admission，请参见Pod Security Admission配置。确认迁移后功能正常，再升级为CCE v1.25版本。如果您不再使用PodSecurityPolicy能力，则可以在删除集群中的PodSecurityPolicy后，直接升级为CCE v1.25版本。 v1.21/v1.19 升级至v1.23 社区较老版本的Nginx Ingress Controller来说（社区版本v0.49及以下，对应CCE插件版本v1.x.x），在创建Ingress时没有指定Ingress类别为nginx，即annotations中未添加kubernetes.io/ingress.class: nginx的情况，也可以被Nginx Ingress Controller纳管。但对于较新版本的Nginx Ingress Controller来说（社区版本v1.0.0及以上，对应CCE插件版本2.x.x），如果在创建Ingress时没有显示指定Ingress类别为nginx，该资源将被Nginx Ingress Controller忽略，Ingress规则失效，导致服务中断。已纳入升级前检查，也可参照nginx-ingress插件升级检查进行自检。 v1.19升级至v1.21 Kubernetes v1.21集群版本修复了exec probe timeouts不生效的BUG，在此修复之前，exec 探测器不考虑 timeoutSeconds 字段。相反，探测将无限期运行，甚至超过其配置的截止日期，直到返回结果。若用户未配置，默认值为1秒。升级后此字段生效，如果探测时间超过1秒，可能会导致应用健康检查失败并频繁重启。升级前检查您使用了exec probe的应用的probe timeouts是否合理。 CCE的v1.19及以上版本的kube-apiserver要求客户侧webhook server的证书必须配置Subject Alternative Names (SAN)字段。否则升级后kube-apiserver调用webhook server失败，容器无法正常启动。根因：Go语言v1.15版本废弃了X.509 CommonName，CCE的v1.19版本的kube-apiserver编译的版本为v1.15，若客户的webhook证书没有Subject Alternative Names (SAN)，kube-apiserver不再默认将X509证书的CommonName字段作为hostname处理，最终导致认证失败。升级前检查您自建webhook server的证书是否配置了SAN字段。若无自建webhook server则不涉及。若未配置，建议您配置使用SAN字段指定证书支持的IP及域名。 v1.15升级至v1.19 CCE v1.19版本的控制面与v1.15版本的Kubelet存在兼容性问题。若Master节点升级成功后，节点升级失败或待升级节点发生重启，则节点有极大概率为NotReady状态。主要原因为升级失败的节点有大概率重启kubelet而触发节点注册流程，v1.15 kubelet默认注册标签（failure-domain.beta.kubernetes.io/is-baremetal和kubernetes.io/availablezone）被v1.19版本kube-apiserver视为非法标签。 v1.19版本中对应的合法标签为node.kubernetes.io/baremetal和failure-domain.beta.kubernetes.io/zone。正常升级流程不会触发此场景。在Master升级完成后尽量避免使用暂停升级功能，快速升级完Node节点。若Node节点升级失败且无法修复，请尽快驱逐此节点上的应用，请联系技术支持人员，跳过此节点升级，在整体升级完毕后，重置该节点。 CCE的v1.15版本集群及v1.19版本集群将docker的存储驱动文件系统由 xfs切换成ext4，可能会导致升级后的java应用Pod内的import包顺序异常，既而导致Pod异常。升级前查看节点上docker配置文件/etc/docker/daemon.json。检查dm.fs配置项是否为xfs。若为ext4或存储驱动为overlay则不涉及。若为xfs则建议您在新版本集群预先部署应用，以测试应用与新版本集群是否兼容。 { "storage-driver": "devicemapper", "storage-opts": [ "dm.thinpooldev=/dev/mapper/vgpaas-thinpool", "dm.use_deferred_removal=true", "dm.fs=xfs", "dm.use_deferred_deletion=true" ] } CCE的v1.19及以上版本的kube-apiserver要求客户侧webhook server的证书必须配置Subject Alternative Names (SAN)字段。否则升级后kube-apiserver调用webhook server失败，容器无法正常启动。根因：Go语言v1.15版本废弃了X.509 CommonName，CCE的v1.19版本的kube-apiserver编译的版本为v1.15。CommonName字段作为hostname处理，最终导致认证失败。升级前检查您自建webhook server的证书是否配置了SAN字段。若无自建webhook server则不涉及。若未配置，建议您配置使用SAN字段指定证书支持的IP及域名。须知：为减弱此版本差异对集群升级的影响，v1.15升级至v1.19时，CCE会进行特殊处理，仍然会兼容支持证书不带SAN。但后续升级不再特殊处理，请尽快整改证书，以避免影响后续升级。 v1.17.17版本及以后的集群CCE自动给用户创建了PSP规则，限制了不安全配置的Pod的创建，如securityContext配置了sysctl的net.core.somaxconn的Pod。升级后请参考资料按需开放非安全系统配置，具体请参见PodSecurityPolicy配置。 1.15版本集群原地升级，如果业务中存在initContainer或使用Istio的场景，则需要注意以下约束： 1.16及以上的kubelet统计QosClass和之前版本存在差异，1.15及以下版本仅统计spec.containers下的容器，1.16及以上的kubelet版本会同时统计spec.containers和spec.initContainers下的容器，升级前后会造成Pod的QosClass变化，从而造成Pod中容器重启。建议参考表1在升级前修改业务容器的QosClass规避该问题。 v1.13升级至v1.15 vpc集群升级后，由于网络组件的升级，master节点会额外占一个网段。在Master占用了网段后，无可用容器网段时，新建节点无法分配到网段，调度在该节点的pod会无法运行。一般集群内节点数量快占满容器网段场景下会出现该问题。例如，容器网段为10.0.0.0/16，可用IP数量为65536，VPC网络IP分配是分配固定大小的网段（使用掩码实现，确定每个节点最多分配多少容器IP），例如上限为128，则此时集群最多支撑65536/128=512个节点，然后去掉Master节点数量为509，此时是1.13集群支持的节点数。集群升级后，在此基础上3台Master节点会各占用1个网段，最终结果就是506台节点。表1 1.15版本升级前后QosClass变化 init容器（根据spec.initContainers计算）业务容器（根据spec.containers计算） Pod（根据spec.containers和spec.initContainers计算）是否受影响 Guaranteed Besteffort Burstable 是 Guaranteed Burstable Burstable 否 Guaranteed Guaranteed Guaranteed 否 Besteffort Besteffort Besteffort 否 Besteffort Burstable Burstable 否 Besteffort Guaranteed Burstable 是 Burstable Besteffort Burstable 是 Burstable Burstable Burstable 否 Burstable Guaranteed Burstable 是

云容器引擎 CCE 升级集群
云容器引擎 CCE-升级概述:升级方式

升级方式表2 升级方式介绍升级方式介绍升级范围优点约束原地升级节点上升级Kubernetes组件、网络组件和CCE管理组件，升级过程中业务Pod和网络均不受影响。升级过程中，节点分批进行升级，存量节点将不可调度，升级完成的批次支持调度新业务。节点操作系统不升级插件在目标版本集群不兼容时自动升级 K8s组件自动升级可一键式升级，用户无需迁移业务，可以基本上保证业务不断。原地升级仅在v1.15及以上版本集群支持。迁移将老版本集群的业务迁移到新版本集群，适用于需要大幅度跨版本集群升级的需求。集群内资源均重新部署。可避免老版本连续升级导致的版本不兼容问题。 -

云容器引擎 CCE 升级集群