搜索_华为云

使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

使用dcgm-exporter监控GPU指标应用场景集群中包含GPU节点时，需要了解GPU应用使用节点GPU资源的情况，例如GPU利用率、显存使用量、GPU运行的温度、GPU的功率等。在获取GPU监控指标后，用户可根据应用的GPU指标配置弹性伸缩策略，或者根据GPU指标设置告

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
更新AddonInstance - 云容器引擎 CCE

"*****", "driver_init_image_version" : "2.1.30", "ecsEndpoint" : "*****", "everest_image_version" : "2.1.30",

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件管理
Volcano调度概述 - 云容器引擎 CCE

Volcano调度概述 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性，提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。 Volcano

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
通过Nginx Ingress对多个应用进行弹性伸缩 - 云容器引擎 CCE

通过Nginx Ingress对多个应用进行弹性伸缩在实际的生产环境中，应用多实例部署可以提高应用的稳定性和可靠性，但也会增加资源的浪费和成本。因此，在进行多实例部署时，需要权衡资源利用率和应用性能之间的平衡，但手动调节实例数量存在伸缩不及时的问题，难以达到最佳的效果。如果该应用使用Nginx

帮助中心 > 云容器引擎 CCE > 最佳实践 > 弹性伸缩
使用GPU虚拟化 - 云容器引擎 CCE

使用GPU虚拟化本文介绍如何使用GPU虚拟化能力实现算力和显存隔离，高效利用GPU设备资源。前提条件已完成GPU虚拟化资源准备。如果您需要通过命令行创建，需要使用kubectl连接到集群，详情请参见通过kubectl连接集群。约束与限制单个GPU卡最多虚拟化成20个GPU虚拟设备。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
公平调度（DRF） - 云容器引擎 CCE

公平调度（DRF） DRF（Dominant Resource Fairness）是主资源公平调度策略，应用于大批量提交AI训练和大数据作业的场景，可增强集群业务的吞吐量，整体缩短业务执行时间，提高训练性能。前提条件已创建v1.19及以上版本的集群，详情请参见购买Standard/Turbo集群。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > AI任务性能增强调度
通过动态存储卷使用对象存储 - 云容器引擎 CCE

通过动态存储卷使用对象存储本文介绍如何自动创建对象存储，适用于无可用的底层存储卷，需要新创建的场景。约束与限制使用对象存储时，挂载点不支持修改属组和权限。使用PVC挂载对象存储时，负载每挂载一个对象存储卷，后端会产生一个常驻进程。当负载使用对象存储数过多或大量读写对象存储

 帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 对象存储（OBS）
容器网络带宽限制的配置建议 - 云容器引擎 CCE

容器网络带宽限制的配置建议应用场景同一个节点上的容器会共用主机网络带宽，对容器的网络带宽进行限制，可以有效避免容器之间相互干扰，提升容器间的网络稳定性。约束与限制 Pod带宽限制功能规格如下：功能规格容器隧道网络模型 VPC网络模型云原生网络2.0模型支持的集群版本

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 容器
监控中心概述 - 云容器引擎 CCE

nt的组件，用于采集指标、日志和应用性能数据。对于在ECS、BMS控制台直接购买的主机，您需手动安装ICAgent。对于集群节点，ICAgent会自动安装，您不用手动安装ICAgent。详情请参见安装ICAgent（华为云主机）。父主题：监控中心

 帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 监控中心
工作负载异常：实例驱逐异常（Evicted） - 云容器引擎 CCE

工作负载异常：实例驱逐异常（Evicted）驱逐原理当节点出现异常时，为了保证工作负载的可用性，Kubernetes会通过驱逐机制（Eviction）将该节点上的Pod调离异常节点。目前Kubernetes中存在两种Eviction机制，分别由kube-controller-manager和kubelet实现。

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
使用Nginx Ingress实现灰度发布和蓝绿发布 - 云容器引擎 CCE

使用Nginx Ingress实现灰度发布和蓝绿发布本文将介绍使用Nginx Ingress实现灰度发布和蓝绿发布的应用场景、用法详解及实践步骤。应用场景使用Nginx Ingress实现灰度发布适用场景主要取决于业务流量切分的策略，目前Nginx Ingress支持基于H

帮助中心 > 云容器引擎 CCE > 最佳实践 > 发布
自定义StorageClass - 云容器引擎 CCE

自定义StorageClass 应用现状 CCE中使用存储时，最常见的方法是创建PVC时通过指定StorageClassName定义要创建存储的类型，如下所示，使用PVC申请一个SAS（高I/O）类型云硬盘/块存储。 apiVersion: v1 kind: PersistentVolumeClaim

帮助中心 > 云容器引擎 CCE > 最佳实践 > 存储
NVIDIA GPU驱动漏洞公告（CVE-2021-1056） - 云容器引擎 CCE

后，能够获取宿主机上所有GPU设备的访问权限。关于漏洞的详细信息，请参见CVE-2021-1056。如果您的CCE集群中存在GPU（ECS）节点，并使用了CCE推荐的NVIDIA GPU驱动版本（Tesla 396.37），按照目前NVIDIA官方公告判断暂不受影响；如果您自行安装或更新过节点上的NVIDIA

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
使用kubectl对接已有极速文件存储卷 - 云容器引擎 CCE

存储容量，单位Gi，必须和已有pv的storage大小保持一致。 volumeName PV的名称。极速文件存储所在VPC，子网必须与工作负载规划部署的ECS虚拟机的VPC保持一致，安全组开放入方向端口(111、445、2049、2051、20048)。创建PV。 kubectl create -f

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储管理-Flexvolume（已弃用） > 极速文件存储卷
通过Kubectl命令行创建ELB Ingress - 云容器引擎 CCE

通过Kubectl命令行创建ELB Ingress 本文以Nginx工作负载为例，说明通过kubectl命令添加ELB Ingress的方法。如您在同一VPC下没有可用的ELB，CCE支持在添加Ingress时自动创建ELB，请参考添加Ingress时自动创建ELB。如您已在

 帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 路由（Ingress） > ELB Ingress管理
存储类（StorageClass） - 云容器引擎 CCE

存储类（StorageClass）存储类介绍在Kubernetes中，StorageClass是一种资源对象，描述了集群中的存储类型“分类”，用于定义存储卷的配置模板。每个StorageClass对象都定义了一种存储方式，包括动态卷供应的配置参数，如卷的类型、访问模式、卷的生

 帮助中心 > 云容器引擎 CCE > 用户指南 > 存储
使用本地临时卷 - 云容器引擎 CCE

卷容量大小创建工作负载。 kubectl apply -f nginx-emptydir.yaml 本地临时卷异常处理说明用户如果手动从ECS侧卸盘、手动执行vgremove两种误操作致临时卷存储池异常。可以先将节点设置为不可调度，具体方法请参见一键设置节点调度策略，然后通过重置节点进行恢复。

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 临时存储卷（EmptyDir）
通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

通过PromQL语句查询Prometheus数据 PromQL是Prometheus Query Language的缩写，是一种用于查询和聚合时间序列数据的查询语言。Prometheus是一个开源的监控系统，用于收集和存储时间序列数据，每个时间序列都由一个唯一的标识符和一组时间戳

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
资源利用率优化调度配置案例 - 云容器引擎 CCE

资源利用率优化调度配置案例概述 Volcano调度分为两个阶段，分别为节点过滤和节点优选，过滤阶段筛选出符合调度条件的节点，优选阶段对所有符合调度条件的节点打分，最终选取得分最高的节点进行调度。Volcano提供多种调度策略进行节点打分优选，每种调度策略可以根据实际业务场景调整

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > 资源利用率优化调度
兼容Kubernetes默认GPU调度模式 - 云容器引擎 CCE

兼容Kubernetes默认GPU调度模式开启GPU虚拟化后，默认该GPU节点不再支持使用Kubernetes默认GPU调度模式的工作负载，即不再支持使用nvidia.com/gpu资源的工作负载。如果您在集群中已使用nvidia.com/gpu资源的工作负载，可在gpu-de

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化

总条数： 581

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

更新AddonInstance - 云容器引擎 CCE

Volcano调度概述 - 云容器引擎 CCE

通过Nginx Ingress对多个应用进行弹性伸缩 - 云容器引擎 CCE

使用GPU虚拟化 - 云容器引擎 CCE

公平调度（DRF） - 云容器引擎 CCE

通过动态存储卷使用对象存储 - 云容器引擎 CCE

容器网络带宽限制的配置建议 - 云容器引擎 CCE

监控中心概述 - 云容器引擎 CCE

工作负载异常：实例驱逐异常（Evicted） - 云容器引擎 CCE

使用Nginx Ingress实现灰度发布和蓝绿发布 - 云容器引擎 CCE

自定义StorageClass - 云容器引擎 CCE

NVIDIA GPU驱动漏洞公告（CVE-2021-1056） - 云容器引擎 CCE

使用kubectl对接已有极速文件存储卷 - 云容器引擎 CCE

通过Kubectl命令行创建ELB Ingress - 云容器引擎 CCE

存储类（StorageClass） - 云容器引擎 CCE

使用本地临时卷 - 云容器引擎 CCE

通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

资源利用率优化调度配置案例 - 云容器引擎 CCE

兼容Kubernetes默认GPU调度模式 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线