检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
init容器不支持使用GPU虚拟化资源。 GPU虚拟化支持显存隔离、显存与算力隔离两种隔离模式。单个GPU卡仅支持调度同一种隔离模式的工作负载。 使用GPU虚拟化后,不支持使用Autoscaler插件自动扩缩容GPU虚拟化节点。 XGPU服务的隔离功能不支持以UVM的方式申请显存,即调用CUDA
参数解释: 集群CPU管理策略。 约束限制: 不涉及 取值范围: none(或空值):关闭工作负载实例独占CPU核的功能,优点是CPU共享池的可分配核数较多 static:支持给节点上的工作负载实例配置CPU独占,适用于对CPU缓存和调度延迟敏感的工作负载,Turbo集群下仅对普通容器节点有效,安全容器节点无效。
隔离。 若存在Uncorrectable Error,可以尝试通过以下手段恢复: 配置目标节点污点(taints),驱逐目标节点存量的业务负载。 重启目标节点。 若重启后仍有该现象,则需要收集nvidia-smi -q命令的输出,然后根据GPU设备所在的节点类型(ECS或BMS),联系对应的客服进行处理。
单击“添加标签”可以设置附加到Kubernetes 对象(比如Pods)上的键值对,最多可以添加20条标签。 使用该标签可区分不同节点,可结合工作负载的亲和能力实现容器Pod调度到指定节点的功能。详细请参见Labels and Selectors。 K8S污点(Taints) 默认为空。
数据请事先备份。 工作节点如在ECS侧自行挂载了数据盘,重置完后会清除挂载信息,重置完成后请重新执行挂载行为,数据不会丢失。 节点上的工作负载实例的IP会发生变化,但是不影响容器网络通信。 云硬盘必须有剩余配额。 操作过程中,后台会把当前节点设置为不可调度状态。 节点重置会清除用户单独添加的
云硬盘详情 在CCE控制台左侧列表中选择“节点管理”,单击“创建节点”,创建一个该可用区的节点。 图4 创建指定可用区的节点 节点创建完成后,工作负载调度器会自动尝试重新调度。 父主题: 模板插件
ernetes.io/dockerconfigjson,其data内容是登录SWR镜像仓库的凭据,用于从SWR拉取镜像。在CCE中创建工作负载时如果需要从SWR拉取镜像,需要配置imagePullSecrets的取值为default-secret,如下所示。 apiVersion:
企业按企业的组织结构或业务形态,将账号有序组织集中管理。统一资源管理并与其他成员共享,节省资源重复配置。统一安全运维管理,便于企业集中配置安全策略,利于审计跟踪。 例如,资源所有者为企业IT账号,创建VPC及子网,并将多个子网分别共享给其他账号: 账号A为企业业务账号,使用子网1创建资源。
产品变更公告 2024/04/26 13 1.23版本集群停止维护公告 集群版本公告 2024/04/25 14 关于CCE集群Docker支持策略公告 产品变更公告 2024/02/19 15 runc漏洞(CVE-2024-21626)对CCE服务的影响说明 漏洞公告 2024/02/01
EvsSnapshot(使用EVS快照备份集群), LabelForSkippedNode(支持为集群升级过程中跳过的节点打标签), UpgradeStrategy(集群升级策略) Value: Support 支持,Disable 关闭,Default 使用CCE服务默认规则判断 表3 Metadata 参数 参数类型
云服务层面的基础设施(如创建节点)。同时也支持调用集群层面的资源(如创建工作负载)。 Kubernetes原生接口:直接通过Kubernetes原生API Server来调用集群层面的资源(如创建工作负载),但不支持操作云服务层面的基础设施(如创建节点)。 Kubernetes原
的路由表路由条目配额,创建前请提前评估集群规模。 VPC路由网络默认支持容器与同一VPC的虚拟机直接互访,与其他VPC的主机在配置对等连接策略后可以支持直接互访。此外,云专线/VPN等混合组网场景在合理规划后可以支持对端直接与容器互访。 父主题: 网络
性的修复建议。 了解更多关于如何使用镜像安全扫描功能,以及如何解读和应用扫描结果中的修复建议,请参见镜像安全扫描。 使用镜像签名并配置验签策略 镜像验签是一种安全机制,用于验证容器镜像是否在创建后被篡改过。镜像的创建者可以对其内容进行签名,使用者则可以通过验证这个签名来确认镜像的完整性和来源。
漏洞公告 漏洞修复策略 NVIDIA Container Toolkit容器逃逸漏洞公告(CVE-2024-0132) Linux CUPS服务RCE 漏洞公告(CVE-2024-47076、CVE-2024-47175、CVE-2024-47176、CVE-2024-47177)
Integer 节点最大允许创建的实例数(Pod),该数量包含系统默认实例,取值范围为16~256。 该设置的目的为防止节点因管理过多实例而负载过重,请根据您的业务需要进行设置。 DockerLVMConfigOverride 否 String Docker数据盘配置项。 待迁移节
适配CCE v1.29集群 新增静默故障码 2.0.9 v1.21 v1.23 v1.25 v1.27 v1.28 修复进程级故障恢复和给工作负载添加注解偶现失败问题 2.0.5 v1.21 v1.23 v1.25 v1.27 v1.28 适配CCE v1.28集群 支持存活探针检查机制
合理分配容器资源。具体操作,请参见合理分配容器计算资源。 在集群中添加新的节点。具体操作,请参见创建节点池。 原因二:Pod创建失败 参考工作负载状态异常定位方法解决创建失败的问题。 插件资源不存在 问题现象 更新或升级插件时,提示更新失败,报 404 错误。 问题原因 插件相关资源
建时需设定默认子网,当创建节点不指定子网时,会填入分区默认子网。 其他属性:分区包含资源类别,即中心云、智能边缘小站。该属性的配置方便后续负载的调度。 约束与限制 节点:分布式集群当前仅支持普通x86虚拟机。暂不支持节点迁移功能。 节点池:节点池随机调度功能仅限于分区内。 存储:
创建。 Immediate:创建PVC时完成PV绑定和动态创建。 WaitForFirstConsumer:延迟PV的绑定和创建,当在工作负载中使用该PVC时才执行PV创建和绑定流程。 创建StorageClass。 kubectl create -f storageclass.yaml
出口网络带宽 开启 在CCE Turbo集群中,支持在线业务与离线业务的网络隔离,详情请参见出口网络带宽保障。 资源超卖 开启 通过实时采集节点负载信息,挖掘节点已分配、但未使用的资源,实现动态超卖节点资源。您可以选择需要超卖的资源类型,默认同时开启CPU和内存资源超卖。详情请参见动态资源超卖。