检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
离,高效利用GPU设备资源。 前提条件 已完成GPU虚拟化资源准备。 如果您需要通过命令行创建,需要使用kubectl连接到集群,详情请参见通过kubectl连接集群。 约束与限制 单个GPU卡最多虚拟化成20个GPU虚拟设备。 init容器不支持使用GPU虚拟化资源。 GPU虚
修改节点最大实例数。详情请参见节点池配置管理。 默认场景下,节点最大实例数最多可调整至256。如果您期望提升节点上的部署密度,您可以提交工单申请调整节点最大实例数,最大支持修改至512个实例。 图2 创建节点时的最大实例数配置 根据节点规格不同,节点默认最大实例数如表1所示。 表1
在弹出的“移除节点”对话框中,配置重装操作系统需要的登录信息,单击“是”,等待完成节点移除。 移除节点后,原有节点上的工作负载实例会自动迁移至其他可用节点。 重装操作系统失败如何处理 移除节点重装操作系统可能会失败,如果碰到这种情况,您可以执行如下步骤重装操作系统并清理节点上的CCE组件。 登录服务器的管理控制台
调度策略添加完成后,单击“创建工作负载”。 验证Pod全部运行在目标节点上。 在集群控制台左侧导航栏中选择“工作负载”。 单击工作负载名称,进入详情页面,查看实例列表,验证Pod全部运行在目标节点上,即节点包含gpu=true标签。 工作负载节点亲和性规则通过节点标签实现。CCE集群中节点在创建
否则,您可以按以下操作手动完成容器镜像的迁移。 远程登录原集群中任意一个节点,使用docker pull命令拉取所有镜像到本地。 登录SWR控制台,单击页面右上角的“登录指令”并复制。 在节点上执行上一步复制的登录指令。 登录成功会显示“Login Succeeded”。 为所有本地镜像打上标签。
容器资源(CPU、内存)配额。 表3 custom 参数 是否必选 参数类型 描述 annotations 否 Map<String>String 用户自定义注解。 表4 resources字段数据结构说明 参数 是否必选 参数类型 描述 limitsCpu 是 String CPU大小限制,单位:m
seconds ago 236MB 把镜像推送到镜像仓库 登录SWR控制台,在左侧选择“我的镜像”,然后单击右侧“客户端上传镜像”,在弹出的窗口中单击“生成临时登录指令”,然后复制该指令在本地机器上执行,登录到SWR镜像仓库。 上传镜像前需要给镜像取一个完整的名称,如下所示:
节点规格(根据实际区域可能存在差异) 通用型:该类型实例提供均衡的计算、存储以及网络配置,适用于大多数的使用场景。通用型实例可用于Web服务器、开发测试环境以及小型数据库工作负载等场景。 内存优化型:该类型实例提供内存比例更高的实例,可以用于对内存要求较高、数据量大的工作负载,例如关系数据库、NoSQL等场景。
basic 参数 是否必选 参数类型 描述 swr_addr 是 String 插件下载地址,无需指定 swr_user 是 String 插件下载用户,无需指定 platform 是 String 插件平台,无需指定 escEndpoint 是 String ecs地址,无需指定 表3 flavor
CCE集群支持创建裸金属节点(VPC网络),支持裸金属和虚机混合部署 GPU支持V100类型 1.11集群对接AOM告警通知机制 Service支持访问类型切换 支持服务网段 集群支持自定义每个节点分配的IP数(IP分配) v1.11.3-r2 主要特性: 集群支持IPv6双栈 ELB负载均衡支持源IP跟后端服务会话保持
磁盘IO延迟 TCP连接 个 TCP连接数 alloc:已分配(已建立、已申请到sk_buff)的TCP套接字数量。 inuse:正在使用(侦听)的TCP套接字数量。 orphan:已分配(已建立、已申请到sk_buff)的TCP套接字数量。 tw:等待关闭的TCP连接数。 UDP使用情况
后再变更节点规格,避免影响业务。 登录CCE控制台,进入集群,在左侧选择“节点管理”,在右侧单击节点名称,跳转到弹性云服务器详情页。 在弹性云服务器详情页中,单击右上角的“关机”,关机完成后单击“更多 > 变更规格”。 在“云服务器变更规格”页面中根据业务需求选择相应的规格,单击
增加:在当前实例数的基础上增加指定的实例数,支持填写实例数或百分比。该动作仅支持扩容实例数。 减少:在当前实例数的基础上减少指定的实例数,支持填写实例数或百分比。该动作仅支持缩容实例数。 说明: 以上执行动作均支持填写具体实例数或百分比。 填写百分比时,还需填写至少存在的实例数。此时默认按以下公式计算最终实例个数:
29 v1.30 修复部分问题 2.1.22 v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 修复了一些页面显示问题 支持查询超节点信息 支持上报显卡拓扑信息 修复了日志打印问题 2.1.14 v1.21 v1.23 v1.25 v1.27 v1
节点池弹性伸缩时,新增10个节点,默认会使用优先级最高的默认规格A,则使用1小时的计费为:0.5735×10 = 5.735元 若创建了5个规格A的实例后遇到规格A资源不足的场景,其余5个实例为规格B,则使用1小时的计费为:0.5735×5 + 1.0015×5 = 7.785元 节点池创建或手动扩容时,如遇
将节点容器引擎从Docker迁移到Containerd CCE节点安全配置建议 工作负载相关 合理分配容器计算资源 在CCE中实现应用高可用部署 升级实例过程中实现业务不中断 通过特权容器功能优化内核参数 使用Init容器初始化应用 CCE中使用x86和ARM双架构镜像 使用SWR触发器自动更新工作负载版本
default 支持初始化时配置,不支持后续修改 - 模板实例命名空间 模板名称 参数名 取值范围 默认值 是否允许修改 作用范围 chart_name 当前用户的模板 无 支持初始化时配置,不支持后续修改 - 模板实例使用的模板 模板版本 参数名 取值范围 默认值 是否允许修改
CCE集群弹性引擎是Kubernetes提供的集群节点弹性伸缩组件,根据Pod调度状态及资源使用情况对集群的节点进行自动扩容缩容,同时支持多可用区、多实例规格、指标触发和周期触发等多种伸缩模式,满足不同的节点伸缩场景。 前提条件 使用节点伸缩功能前,需要安装CCE集群弹性引擎插件,插件版本要求1
latest 22f2bf2e2b4f 5 hours ago 22.8MB 将步骤1中下载的镜像上传到SWR。 登录到目标端容器所在虚拟机,并登录SWR。详细步骤请参考客户端上传镜像。 给镜像打标签。 docker tag [镜像名称:版本名称] [镜像仓库地址]/[组织名称]/[镜像名称:版本名称]
CCE提供了如下两种EmptyDir类型: 临时路径:Kubernetes原生的EmptyDir类型,生命周期与容器实例相同,并支持指定内存作为存储介质。容器实例消亡时,EmptyDir会被删除,数据会永久丢失。 本地临时卷:本地临时存储卷将节点的本地数据盘通过LVM组成存储池(