检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
节点限制检查异常处理 检查项内容 当前检查项包括以下内容: 检查节点是否可用 检查节点操作系统是否支持升级 检查节点是否含有非预期的节点池标签 检查K8s节点名称是否与云服务器保持一致 解决方案 检查到节点状态异常,请优先恢复 若检查发现节点不可用,请登录CCE控制台,单击集群名
用户:选择一个IAM用户,吊销其集群凭证。 委托账号:选择一个委托账号,吊销其集群凭证。 指定用户ID/委托ID:若您的用户已经删除,或者您通过身份提供商方式登录,需要您手动填写用户 ID。若您的委托账号已经删除,需要您手动填写委托 ID。 您可以通过以下方案获取 ID: 方式一:如果您可
启用/停用:自定义某个检查项的开启或关闭。 目标节点配置:检查项默认运行在全部节点,用户可根据特殊场景需要自定义修改故障阈值。例如竞价实例中断回收检查只运行在竞价实例节点。 触发阈值配置:默认阈值匹配常见故障场景,用户可根据特殊场景需要自定义修改故障阈值。例如调整“连接跟踪表耗尽”触发阈值由90%调整至80%。
在有状态负载中动态挂载专属存储 使用场景 动态挂载仅可在创建有状态负载(StatefulSet)时使用,通过卷声明模板(volumeClaimTemplates字段)实现,并依赖于StorageClass的动态创建PV能力。在多实例的有状态负载中,动态挂载可以为每一个Pod关联一
WaitForFirstConsumer 表1 StorageClass部分参数说明 参数 说明 provisioner 存储资源提供商,CCE均由everest插件提供,此处只能填写everest-csi-provisioner。 parameters 存储参数,不同类型的存储支持的参数
Volume的生命周期与Pod相同,Pod删除后Volume的数据也同时删除掉。 emptyDir的一些用途: 缓存空间,例如基于磁盘的归并排序。 为耗时较长的计算任务提供检查点,以便任务能从崩溃前状态恢复执行。 emptyDir配置示例如下。 apiVersion: v1 kind: Pod metadata:
com/gpu资源的工作负载)。 在工作负载中声明nvidia.com/gpu资源(即配置nvidia.com/gpu为小数,例如0.5)时将通过虚拟化GPU提供,实现GPU显存隔离,按照设定值的百分比为容器分配GPU显存(例如分配0.5×16GiB=8GiB的GPU显存,该数值需为128MiB的整
CCE控制台的权限依赖 CCE对其他云服务有诸多依赖关系,因此在您开启IAM授权后,在CCE Console控制台的各项功能需要配置相应的服务权限后才能正常查看或使用,详细说明如下: 依赖服务的权限配置均基于您已设置了IAM授权的CCE FullAccess或CCE ReadOn
替代。 CCE对Kubernetes 1.30版本的增强 在版本维护周期中,CCE会对Kubernetes 1.30版本进行定期的更新,并提供功能增强。 关于CCE集群版本的更新说明,请参见补丁版本发布说明。 参考链接 关于Kubernetes 1.30与其他版本的性能对比和功能
替代。 CCE对Kubernetes 1.30版本的增强 在版本维护周期中,CCE会对Kubernetes 1.30版本进行定期的更新,并提供功能增强。 关于CCE集群版本的更新说明,请参见补丁版本发布说明。 参考链接 关于Kubernetes 1.30与其他版本的性能对比和功能
2为默认模式表示当前卡还没被用于XGPU设备分配 xgpu_device_health Gauge XGPU设备的健康情况。当前虚拟化域侧并没有提供特定的接口来检查XGPU的健康情况,所以根据XGPU设备所在物理GPU设备的健康情况反推。0表示XGPU设备为健康状态,1表示为非健康状态。
修改“采集配置”。 监控采集任务配置由系统预置采集配置、ServiceMonitor采集配置、PodMonitor采集配置和Targets采集配置配置项共同提供。 系统预置采集配置 为保证插件默认行为的一致性,系统预置采集功能默认不开启,强烈建议您开启系统预置采集功能。 开启预置采集后,系统预置的
性检查所有节点状态,当节点处于NotReady状态超过一段时间后,驱逐该节点上所有Pod。 kube-controller-manager提供了以下启动参数控制驱逐: pod-eviction-timeout:即当节点宕机时间超过一定的时间间隔后,开始驱逐宕机节点上的Pod,默认为5min。
共享功能,多个节点挂载使用同一个云硬盘可能会出现读写冲突、数据缓存冲突等问题,所以创建无状态工作负载时,若使用了EVS云硬盘,建议工作负载只选择一个实例。 1.19.10以下版本的集群中,如果使用HPA策略对挂载了EVS卷的负载进行扩容,当新Pod被调度到另一个节点时,会导致之前Pod不能正常读写。
的数据共享功能,多个节点挂载使用同一个磁盘可能会出现读写冲突、数据缓存冲突等问题,所以创建无状态工作负载时,若使用了专属存储,建议工作负载只选择一个实例。 如果使用HPA策略对挂载了专属存储的负载进行扩容,新Pod会因为无法挂载磁盘导致无法成功启动。 动态创建专属存储卷时支持添加
最小支持下调至20G,节点上挂载的普通数据盘支持下调至10G。 调整容器运行时和Kubelet组件使用的数据盘大小存在一些风险,根据本文提供的预估方法,建议综合评估后再做实际调整。 过小的数据盘容量可能会频繁出现磁盘空间不足,导致镜像拉取失败的问题。如果节点上需要频繁拉取不同的镜像,不建议将数据盘容量调小。
28.8-r0、v1.29.4-r0及以上集群版本中,支持通过集群或节点池配置将软链方式修改为挂载,且节点池配置优先级高于集群配置。 当前仅提供API方式创建: 创建集群API示例如下,其余参数配置说明请参见创建集群。 POST /api/v3/projects/{project_id}/clusters
镜像中调用的命令无法执行,例如文件权限不足或文件不可执行。 127 找不到文件或目录 无法找到镜像中指定的文件或目录。 128 无效的退出参数 容器退出但未提供有效的退出代码,可能的原因有多种,需要进一步定位原因。例如containerd节点上运行的应用尝试调用docker命令。 137 立即终止(SIGKILL)
421802","public_ip_address":"3.3.3.3"}' # 自定义的EIP配置成功后,记录了配置的EIP的ID和IP地址 kubernetes.io/elb.id: aed5d5c9-65eb-42ab-9f80-57825cbae309 kubernetes
共享功能,多个节点挂载使用同一个云硬盘可能会出现读写冲突、数据缓存冲突等问题,所以创建无状态工作负载时,若使用了EVS云硬盘,建议工作负载只选择一个实例。 1.19.10以下版本的集群中,如果使用HPA策略对挂载了EVS卷的负载进行扩容,当新Pod被调度到另一个节点时,会导致之前Pod不能正常读写。