搜索_华为云

插件概述 - 云容器引擎 CCE
插件概述 - 云容器引擎 CCE

AI套件（NVIDIA GPU）是支持在容器中使用GPU显卡的设备管理插件，仅支持Nvidia驱动。 CCE AI套件（Ascend NPU） CCE AI套件（Ascend NPU）是支持容器里使用Huawei NPU设备的管理插件。容器网络插件插件名称插件简介 CoreDNS域名解析

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件
Linux CUPS服务RCE 漏洞公告（CVE-2024-47076、CVE-2024-47175、CVE-2024-47176、CVE-2024-47177） - 云容器引擎 CCE

CVE-2024-47177 严重 2024-09-26 漏洞影响该漏洞主要影响运行 CUPS 打印系统的 Unix 设备，若同时启用了 cups-browsed 服务，可能面临被远程攻击的风险，从而危及用户设备的安全。判断方法您可以在节点上执行以下命令查看是否安装CUPS相关服务： systemctl

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
GPU故障处理 - 云容器引擎 CCE
GPU故障处理 - 云容器引擎 CCE

d错误引起，可能是驱动、硬件或权限问题导致的。隔离故障GPU节点的GPU设备 NVML获取设备UUID异常 Xid=%d on Device=%s, UUID=%s, SN=%s, the device will go unhealthy. GPU设备存在严重的Xid错误：此类

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
NVIDIA GPU驱动漏洞公告（CVE-2021-1056） - 云容器引擎 CCE

GPU驱动的一个漏洞CVE-2021-1056，该漏洞是存在于NVIDIA GPU驱动程序中与设备隔离相关的安全漏洞。当容器以非特权模式启动，攻击者利用这个漏洞，通过在容器中创建特殊的字符设备文件后，能够获取宿主机上所有GPU设备的访问权限。关于漏洞的详细信息，请参见CVE-2021-1056。如

 帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

cluster_version 否 String CCE集群版本 device_version 是 String 插件的版本 driver_version 是 String 插件安装驱动时，插件里负责安装驱动的Pod的镜像tag，一般与device_version相同 obs_url 是 String

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
XGPU视图 - 云容器引擎 CCE
XGPU视图 - 云容器引擎 CCE

每个节点的GPU虚拟化设备数量节点-XGPU设备显存分配量字节每个节点上的GPU虚拟化设备显存总量 GPU卡-XGPU设备显存使用率百分比每张GPU卡上的GPU虚拟化设备显存使用率计算公式：显卡上所有XGPU设备的显存使用量之和 / 显卡显存总量 GPU卡-XGPU设备显存分配量

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
准备GPU虚拟化资源 - 云容器引擎 CCE

准备GPU虚拟化资源 CCE GPU虚拟化采用自研xGPU虚拟化技术，能够动态对GPU设备显存与算力进行划分，单个GPU卡最多虚拟化成20个GPU虚拟设备。本文介绍如何在GPU节点上实现GPU的调度和隔离能力。前提条件配置支持版本集群版本 v1.23.8-r0、v1.25

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
GPU虚拟化概述 - 云容器引擎 CCE

GPU虚拟化概述 CCE GPU虚拟化采用自研xGPU虚拟化技术，能够动态对GPU设备显存与算力进行划分，单个GPU卡最多虚拟化成20个GPU虚拟设备。相对于静态分配来说，虚拟化的方案更加灵活，最大程度保证业务稳定的前提下，可以完全由用户自己定义使用的GPU量，提高GPU利用率。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
容器使用SCSI类型云硬盘偶现IO卡住如何解决？ - 云容器引擎 CCE

问题原理 BUS 0上热插PCI设备后，Linux内核会多次遍历挂载在BUS 0上的所有PCI-Bridge，且PCI-Bridge在被更新期间无法正常工作。在此期间，若设备使用的PCI-Bridge被更新，由于内核缺陷，该设备会认为PCI-Bridge异常，设备进入故障模式进而无法正常

 帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
CCE AI套件（Ascend NPU） - 云容器引擎 CCE

cluster_version 是 String CCE集群版本 device_version 是 String 插件的版本 driver_version 是 String 插件开启自动安装驱动时，插件里负责安装驱动的Pod的镜像tag，一般与device_version相同 swr_addr 是 String

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
对象存储概述 - 云容器引擎 CCE

场景。标准接口：具备标准Http Restful API接口，用户必须通过编程或第三方工具访问对象存储。数据共享：服务器、嵌入式设备、IOT设备等所有调用相同路径，均可访问共享的对象存储数据。公共/私有网络：对象存储数据允许在公网访问，满足互联网应用需求。容量与性能：容量

 帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 对象存储（OBS）
删除挂载了云存储的Pod时提示target is busy - 云容器引擎 CCE

busy 问题根因出现以上问题的原因是宿主机上有其他进程正在使用该设备。解决方法您需要登录到Pod所在宿主机上查找正在使用该设备的进程，并终止对应的进程。登录Pod所在节点。执行以下命令，找到对应挂载路径下的云存储设备，其中<mount-path>为错误信息中显示的挂载路径。 mount

帮助中心 > 云容器引擎 CCE > 常见问题 > 存储管理
使用GPU虚拟化 - 云容器引擎 CCE

本文介绍如何使用GPU虚拟化能力实现算力和显存隔离，高效利用GPU设备资源。前提条件已完成GPU虚拟化资源准备。如果您需要通过命令行创建，需要使用kubectl连接到集群，详情请参见通过kubectl连接集群。约束与限制单个GPU卡最多虚拟化成20个GPU虚拟设备。 init容器不支持使用GPU虚拟化资源。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
云服务器事件处理建议 - 云容器引擎 CCE

在云容器引擎CCE中，您可以采用弹性云服务器ECS实例作为Node节点来构建高可用的Kubernetes集群。在日常运维中，华为云会对ECS实例所在底层宿主机的软硬件故障进行预测和主动规避。当宿主机上的故障风险无法规避时，为避免因ECS实例的资源可用性或性能受损对您的业务造成更大的影响，系统会对受影响

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维
选择GPU节点驱动版本 - 云容器引擎 CCE

Toolkit。如何选择GPU节点驱动版本一般情况下，使用GPU资源时您将会使用以下软件包，并且软件包版本需要保持配套：驱动GPU工作的硬件驱动程序，如Tesla系列驱动。上层应用程序所需要的库，如CUDA Toolkit工具包。在容器使用场景下，GPU驱动是安装在节点上的，而CUDA

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
主机视图 - 云容器引擎 CCE
主机视图 - 云容器引擎 CCE

主机视图从主机视角出发，监控主机的资源占用与健康状态，查看主机的磁盘、文件系统等常用系统设备指标，帮助您掌控节点运行状况。指标说明主机视图暴露的指标具体说明如下：图1 主机资源指标表1 视图说明图表名称单位说明 CPU使用率百分比每个CPU核的使用率平均负载

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
CCE AI套件（Ascend NPU） - 云容器引擎 CCE

npu-driver-installer 该容器运行在NPU节点上，负责安装NPU驱动。 DaemonSet huawei-npu-device-plugin 支持容器里使用huawei NPU设备的管理插件。 DaemonSet NPU指标指标监控级别备注 cce_npu_memory_total

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生异构计算插件
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

GPU驱动的工作负载，仅在安装场景占用资源，安装完成后无资源占用。 DaemonSet nvidia-gpu-device-plugin 为容器提供Nvidia GPU异构算力的Kubernetes设备插件。 DaemonSet nvidia-operator 为集群提供Nvidia GPU节点管理能力。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生异构计算插件
责任共担 - 云容器引擎 CCE
责任共担 - 云容器引擎 CCE

之上”。针对层出不穷的云安全挑战和无孔不入的云安全威胁与攻击，华为云在遵从法律法规业界标准的基础上，以安全生态圈为护城河，依托华为独有的软硬件优势，构建面向不同区域和行业的完善云服务安全保障体系。安全性是华为云与您的共同责任，如图1所示。华为云：负责云服务自身的安全，提供安全

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 安全
异构资源配置 - 云容器引擎 CCE

异构资源配置 GPU配置 GPU虚拟化：CCE GPU虚拟化采用自研xGPU虚拟化技术，能够动态对GPU设备显存与算力进行划分，单个GPU卡最多虚拟化成20个GPU虚拟设备。相对于静态分配来说，虚拟化的方案更加灵活，最大程度保证业务稳定的前提下，可以完全由用户自己定义使用的GPU

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心

总条数： 116

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

插件概述 - 云容器引擎 CCE

Linux CUPS服务RCE 漏洞公告（CVE-2024-47076、CVE-2024-47175、CVE-2024-47176、CVE-2024-47177） - 云容器引擎 CCE

GPU故障处理 - 云容器引擎 CCE

NVIDIA GPU驱动漏洞公告（CVE-2021-1056） - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

XGPU视图 - 云容器引擎 CCE

准备GPU虚拟化资源 - 云容器引擎 CCE

GPU虚拟化概述 - 云容器引擎 CCE

容器使用SCSI类型云硬盘偶现IO卡住如何解决？ - 云容器引擎 CCE

CCE AI套件（Ascend NPU） - 云容器引擎 CCE

对象存储概述 - 云容器引擎 CCE

删除挂载了云存储的Pod时提示target is busy - 云容器引擎 CCE

使用GPU虚拟化 - 云容器引擎 CCE

云服务器事件处理建议 - 云容器引擎 CCE

选择GPU节点驱动版本 - 云容器引擎 CCE

主机视图 - 云容器引擎 CCE

CCE AI套件（Ascend NPU） - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

责任共担 - 云容器引擎 CCE

异构资源配置 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线