检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GPU调度 GPU节点驱动版本 使用Kubernetes默认GPU调度 GPU虚拟化 监控GPU资源指标 CCE AI套件(NVIDIA GPU)插件使用DCGM-Exporter监控GPU指标 基于GPU监控指标的工作负载弹性伸缩配置 GPU虚拟化节点弹性伸缩配置 GPU故障处理
创建方式:选择“已有存储卷”。 关联存储卷:选择上一步中已创建的存储卷。 前往“工作负载”页面,查看原来的有状态工作负载,单击“更多>编辑YAML”,单击“下载”或复制YAML文件的全部内容,在本地进行备份。 删除原来的有状态应用,并将上一步复制的工作负载YAML配置进行以下修改: volumeC
Cloud EulerOS 2.0操作系统 GPU类型 支持T4、V100类型的GPU 驱动版本 GPU虚拟化功能仅支持470.57.02、510.47.03、535.54.03版本的GPU驱动。 运行时 仅支持containerd 插件 集群中需要同时安装以下插件: Volcano调度器插件:1
资源更新适配 镜像更新适配 由于本例使用的Wordpress和MySQL镜像均可从SWR正常拉取,因此不会出现镜像拉取失败(ErrImagePull)问题。如迁移应用为私有镜像,请执行以下步骤完成镜像更新适配。 将镜像资源迁移至容器镜像服务(SWR),具体步骤请参考客户端上传镜像。
CCE AI套件(NVIDIA GPU) CCE AI套件(NVIDIA GPU)是支持在容器中使用GPU显卡的设备管理插件,仅支持Nvidia驱动。 CCE AI套件(Ascend NPU) CCE AI套件(Ascend NPU)是支持容器里使用Huawei NPU设备的管理插件。
关闭操作时,节点关闭才被认为是体面的。详情请参见处理节点非体面关闭。 支持在挂载时将Pod fsGroup传递给CSI驱动程序 将fsGroup委托给CSI驱动程序管理首先在Kubernetes 1.22中作为Alpha特性引入, 并在Kubernetes 1.25中进阶至Beta状态。该特性在Kubernetes
关闭操作时,节点关闭才被认为是体面的。详情请参见处理节点非体面关闭。 支持在挂载时将Pod fsGroup传递给CSI驱动程序 将fsGroup委托给CSI驱动程序管理首先在Kubernetes 1.22中作为Alpha特性引入, 并在Kubernetes 1.25中进阶至Beta状态。该特性在Kubernetes
集群上安装了CCE AI套件(GPU/NPU),可参考CCE AI套件(NVIDIA GPU)和 CCE AI套件(Ascend NPU)。其中NPU驱动版本应大于23.0。 操作步骤 您可以在集群节点上查询GPU/NPU卡的信息,然后使用kubectl搜索到使用该卡的Pod。 GPU场景 NPU场景
整体应用容器化改造 本教程以“整体应用容器化改造”为例,指导您将一个“部署在虚拟机上的ERP企业管理系统”进行容器化改造,部署到容器服务中。 您不需要改动任何代码和架构,仅需将整体应用构建为容器镜像,部署到云容器引擎中。 本例应用简介 本例“企业管理应用”由某企业(简称A企业)开
docker审计日志量过大影响磁盘IO如何解决? thinpool磁盘空间耗尽导致容器或节点异常时,如何解决? CCE节点上监听的端口列表 GPU节点使用nvidia驱动启动容器排查思路 CCE节点NTP时间不同步如何解决? Containerd节点业务容器标准输出日志写入过快导致节点数据盘使用率过高 为什么kubectl
rd容器引擎的节点要求ICAgent版本为5.12.130及以上。 容器文件日志采集目前仅支持overlay2存储驱动,不支持Device Mapper作为存储驱动的节点。 详细限制说明请参见CCE接入 > 约束限制。 每个工作负载需单独配置。 日志采集策略与Pod配置耦合,修改日志配置会重启Pod。
仓库(Repository):仓库是用于存放共享模板包的地方,您可以从仓库中下载模板包至本地安装,也可以选择直接在线安装。 实例(Release):实例是Helm在Kubernetes集群中安装模板包后的运行结果。一个模板包通常可以在一个集群中安装多次,每次安装都会创建一个新的实例。以MySQL模板包为例,如果您想在
使用高版本Docker(>= docker v1.11)重新打包镜像。 手动下载镜像 登录节点。 执行如下命令手动下载镜像。 ctr -n k8s.io images pull --user u:p images 使用新下载的镜像重新创建工作负载。 父主题: 其他
编辑YAML 可通过在线YAML编辑窗对无状态工作负载、有状态工作负载、守护进程集、定时任务和容器组的YAML文件进行修改和下载。普通任务的YAML文件仅支持查看、复制和下载。 说明: 如果对已有的定时任务(CronJob)进行修改,修改之后运行的新Pod将使用新的配置,而已经运行的Pod将继续运行不会发生任何变化。
单击左侧导航栏的“配置中心”,选择“异构资源配置”页签。 在“GPU配置”中找到“节点池配置”,并选择新增的目标节点池。 参考准备GPU虚拟化资源,选择满足GPU虚拟化要求的驱动,并开启支持GPU虚拟化。 图1 异构资源配置 单击“确认配置”进行保存。 步骤三:创建GPU虚拟化负载并扩容 参考使用GPU虚拟化章节,
cy: Delete storageClassName: nfs-rw 表1 关键参数说明 参数 描述 driver 挂载依赖的存储驱动,文件存储配置为“huawei.com/fuxinfs”。 deviceMountPath 文件存储的共享路径。 获取方法:在CCE控制台,单击顶部的“服务列表
Delete storageClassName: obs-standard 表1 关键参数说明 参数 描述 driver 挂载依赖的存储驱动,对象存储配置为“huawei.com/fuxiobs”。 storage_class 存储类型,包括STANDARD(标准桶)、STANDARD_IA(低频访问桶)。
(NVIDIA GPU)是在容器中使用GPU显卡的设备管理插件,集群中使用GPU节点时必须安装该插件。安装GPU驱动时,需要匹配GPU类型和CUDA版本选择对应的驱动进行安装。 云原生监控插件(kube-prometheus-stack)负责监控集群相关指标信息,安装时可选择对接
system命名空间下everest-csi-controller和everest-csi-driver就是CCE开发存储控制器和驱动。有了这些驱动就可以使用EVS、SFS、OBS存储。 $ kubectl get po --namespace=kube-system NAME
通过安全容器,不同容器之间的内核、计算资源、网络都是隔离开的,保护了Pod的资源和数据不被其他Pod抢占和窃取。 商用 7 CCE Turbo集群容器引擎存储驱动支持OverlayFS2 CCE Turbo集群中的CentOS 7.6和Ubuntu 18.04节点,以及CCE集群中的Ubuntu 18