搜索_华为云

GPU虚拟化概述 - 云容器引擎 CCE

GPU虚拟化概述 CCE GPU虚拟化采用自研xGPU虚拟化技术，能够动态对GPU设备显存与算力进行划分，单个GPU卡最多虚拟化成20个GPU虚拟设备。相对于静态分配来说，虚拟化的方案更加灵活，最大程度保证业务稳定的前提下，可以完全由用户自己定义使用的GPU量，提高GPU利用率。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
准备GPU虚拟化资源 - 云容器引擎 CCE

准备GPU虚拟化资源 CCE GPU虚拟化采用自研xGPU虚拟化技术，能够动态对GPU设备显存与算力进行划分，单个GPU卡最多虚拟化成20个GPU虚拟设备。本文介绍如何在GPU节点上实现GPU的调度和隔离能力。前提条件配置支持版本集群版本 v1.23.8-r0、v1.25

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
GPU虚拟化 - 云容器引擎 CCE
GPU虚拟化 - 云容器引擎 CCE

GPU虚拟化 GPU虚拟化概述准备GPU虚拟化资源使用GPU虚拟化兼容Kubernetes默认GPU调度模式父主题： GPU调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
使用GPU虚拟化 - 云容器引擎 CCE

使用GPU虚拟化本文介绍如何使用GPU虚拟化能力实现算力和显存隔离，高效利用GPU设备资源。前提条件已完成GPU虚拟化资源准备。如果您需要通过命令行创建，需要使用kubectl连接到集群，详情请参见通过kubectl连接集群。约束与限制单个GPU卡最多虚拟化成20个GPU虚拟设备。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
CCE节点故障检测 - 云容器引擎 CCE

款监控集群节点异常事件的插件，以及对接第三方监控平台功能的组件。它是一个在每个节点上运行的守护程序，可从不同的守护进程中搜集节点问题并将其报告给apiserver。NPD可以作为DaemonSet运行，也可以独立运行。 CCE节点故障检测插件基于社区开源项目node-probl

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
GPU虚拟化节点弹性伸缩配置 - 云容器引擎 CCE

在“GPU配置”中找到“节点池配置”，并选择新增的目标节点池。参考准备GPU虚拟化资源，选择满足GPU虚拟化要求的驱动，并开启支持GPU虚拟化。图1 异构资源配置单击“确认配置”进行保存。步骤三：创建GPU虚拟化负载并扩容参考使用GPU虚拟化章节，创建使用GPU虚拟化资源的无状态负载，并将GPU申请量设为大

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
整体应用容器化改造 - 云容器引擎 CCE

整体应用容器化改造本教程以“整体应用容器化改造”为例，指导您将一个“部署在虚拟机上的ERP企业管理系统”进行容器化改造，部署到容器服务中。您不需要改动任何代码和架构，仅需将整体应用构建为容器镜像，部署到云容器引擎中。本例应用简介本例“企业管理应用”由某企业（简称A企业）开

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 容器化改造 > 企业管理应用容器化改造（ERP） > 实施步骤
容器化改造 - 云容器引擎 CCE
容器化改造 - 云容器引擎 CCE

容器化改造企业管理应用容器化改造（ERP）

帮助中心 > 云容器引擎 CCE > 最佳实践
应用容器化改造方案概述 - 云容器引擎 CCE

支持Kubernetes社区原生应用和工具，简化云上自动化容器运行环境搭建。为什么需要使用容器更高效的利用系统资源。容器不需要硬件虚拟化以及运行完整操作系统等额外开销，所以对系统资源利用率更高。相比虚拟机技术，一个相同配置的主机，往往可以运行更多数量的应用。更快速的启动时间。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 容器化改造 > 企业管理应用容器化改造（ERP）
集群诊断 - 云容器引擎 CCE
集群诊断 - 云容器引擎 CCE

丰富的诊断能力，请参考开通监控中心开通。配置定时巡检规则在“健康诊断”页面右上角打开“定时巡检”开关，并配置定时巡检启动的时间。集群将在指定时间自动开始集群巡检任务。单个集群，每天仅支持配置一个定时巡检时间。图1 定时巡检手动发起诊断当您初次使用健康诊断时，单击“马上诊

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 健康中心
容器 - 云容器引擎 CCE
容器 - 云容器引擎 CCE

容器容器与Docker 容器技术起源于Linux，是一种内核虚拟化技术，提供轻量级的虚拟化，以便隔离进程和资源。尽管容器技术已经出现很久，却是随着Docker的出现而变得广为人知。Docker是第一个使容器能在不同机器之间移植的系统。它不仅简化了打包应用的流程，也简化了打包应用

 帮助中心 > 云容器引擎 CCE > Kubernetes基础知识 > 容器与Kubernetes
健康中心概述 - 云容器引擎 CCE

针对诊断结果，智能给出健康评分支持定时巡检，并可视化巡检结果支持查看巡检历史，方便用户分析故障原因针对故障和潜在风险，给出风险等级并提供修复建议使用场景运维对集群做变更前的集群状况检测，可随时主动触发健康诊断支持运维的定时巡检，可设置定时执行时间，定期检查集群风险集

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 健康中心
兼容Kubernetes默认GPU调度模式 - 云容器引擎 CCE

已经使用nvidia.com/gpu资源，则不会转成虚拟化GPU，依然使用整卡资源。开启GPU虚拟化时，在工作负载中设置nvidia.com/gpu等价于开启虚拟化GPU显存隔离，可以和显存隔离模式（即设置volcano.sh/gpu-mem.128Mi资源）的工作负载共用一张

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
通过AOM配置自定义告警 - 云容器引擎 CCE

通过AOM配置自定义告警 CCE对接AOM并上报告警和事件，通过在AOM中设置告警规则，您可以及时了解集群中各种资源是否存在异常。告警配置流程在SMN创建主题。创建行动规则。添加告警规则。事件类告警：根据集群上报到AOM的事件配置告警。推荐配置的事件和配置方法请参见添加事件类告警。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
改造流程 - 云容器引擎 CCE
改造流程 - 云容器引擎 CCE

改造流程整体应用容器化改造时，需要执行完整的改造流程。容器化改造流程包括：分析应用、准备应用运行环境、编写开机脚本、编写Dockerfile、制作并上传镜像、创建容器工作负载。改造流程每一部分的详情可参考改造流程。图1 容器化改造流程父主题：实施步骤

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 容器化改造 > 企业管理应用容器化改造（ERP） > 实施步骤
容器resource资源 - 云容器引擎 CCE

st配置相同 GPU虚拟化资源：显存参数名取值范围默认值是否允许修改作用范围 volcano.sh/gpu-mem.128Mi 1-16384间整数无允许 - 虚拟化GPU显存资源，若配置limit和request相同，可独立配置 GPU虚拟化资源：算力参数名取值范围

 帮助中心 > 云容器引擎 CCE > 配置参考 > Pod
XGPU视图 - 云容器引擎 CCE
XGPU视图 - 云容器引擎 CCE

个每个节点的GPU虚拟化设备数量节点-XGPU设备显存分配量字节每个节点上的GPU虚拟化设备显存总量 GPU卡-XGPU设备显存使用率百分比每张GPU卡上的GPU虚拟化设备显存使用率计算公式：显卡上所有XGPU设备的显存使用量之和 / 显卡显存总量 GPU卡-XGPU设备显存分配量

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
创建节点 - 云容器引擎 CCE
创建节点 - 云容器引擎 CCE

集群管理的URL格式为：https://Endpoint/uri。其中uri为资源路径，也即API访问的路径。接口约束仅支持创建KVM虚拟化类型的节点，非KVM虚拟化类型的节点创建后无法正常使用。调用方法请参见如何调用API。 URI POST /api/v3/projects/{pr

帮助中心 > 云容器引擎 CCE > API参考 > API > 节点管理
持久化存储 - 云容器引擎 CCE
持久化存储 - 云容器引擎 CCE

持久化存储 Volume PV、PVC和StorageClass

帮助中心 > 云容器引擎 CCE > Kubernetes基础知识
异构资源配置 - 云容器引擎 CCE

异构资源配置 GPU配置 GPU虚拟化：CCE GPU虚拟化采用自研xGPU虚拟化技术，能够动态对GPU设备显存与算力进行划分，单个GPU卡最多虚拟化成20个GPU虚拟设备。相对于静态分配来说，虚拟化的方案更加灵活，最大程度保证业务稳定的前提下，可以完全由用户自己定义使用的GPU

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心

总条数： 364

上一页
1
2
3
4
5
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU虚拟化概述 - 云容器引擎 CCE

准备GPU虚拟化资源 - 云容器引擎 CCE

GPU虚拟化 - 云容器引擎 CCE

使用GPU虚拟化 - 云容器引擎 CCE

CCE节点故障检测 - 云容器引擎 CCE

GPU虚拟化节点弹性伸缩配置 - 云容器引擎 CCE

整体应用容器化改造 - 云容器引擎 CCE

容器化改造 - 云容器引擎 CCE

应用容器化改造方案概述 - 云容器引擎 CCE

集群诊断 - 云容器引擎 CCE

容器 - 云容器引擎 CCE

健康中心概述 - 云容器引擎 CCE

兼容Kubernetes默认GPU调度模式 - 云容器引擎 CCE

通过AOM配置自定义告警 - 云容器引擎 CCE

改造流程 - 云容器引擎 CCE

容器resource资源 - 云容器引擎 CCE

XGPU视图 - 云容器引擎 CCE

创建节点 - 云容器引擎 CCE

持久化存储 - 云容器引擎 CCE

异构资源配置 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线