搜索_华为云

CCE AI套件（NVIDIA GPU）插件使用DCGM-Exporter监控GPU指标 - 云容器引擎 CCE

用情况、健康状态、工作负载性能等，从而实现对异常问题的快速诊断、优化GPU资源的分配、提升资源利用率等。除运维人员以外，其他人员（例如数据科学家、AI算法工程师等）也能通过相关监控指标了解业务的GPU使用情况，以便进行容量规划和任务调度。新一代NVIDIA支持使用数据中心GPU

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
调度算法 - 云容器引擎 CCE
调度算法 - 云容器引擎 CCE

特性，实现业务对集群资源的充分利用；从节点维度来看，混部是将多个容器部署在同一个节点上，这些容器内的应用既包括在线类型，也包括离线类型。根据应用对资源质量需求的差异，在线应用可以归纳为延时敏感型LS（Latency Sensitive），通常对请求压力（QPS）或访问延迟（RT）

帮助中心 > 云容器引擎 CCE > 配置参考 > 集群
按需计费 - 云容器引擎 CCE
按需计费 - 云容器引擎 CCE

用户。本文将介绍云容器引擎中购买按需计费资源的计费规则。适用场景按需计费适用于短期突增或不可预测的应用或服务，例如电商抢购、临时测试、科学计算。适用计费项使用云容器引擎CCE时，表1中的计费项支持从CCE控制台选择计费模式（包年/包月或按需计费）。CCE相关的其他云服务资

 帮助中心 > 云容器引擎 CCE > 计费说明 > 计费模式
动态资源超卖 - 云容器引擎 CCE

节点，离线作业优先调度到超卖节点。在线作业预选超卖节点时只能使用其非超卖资源在线作业只能使用超卖节点的非超卖资源，离线作业可以使用超卖节点的超卖及非超卖资源。同一调度周期在线作业先于离线作业调度在线作业和离线作业同时存在时，优先调度在线作业。当节点资源使用率超过设定的驱逐

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > 云原生混部
高性能调度 - 云容器引擎 CCE
高性能调度 - 云容器引擎 CCE

优先级施加到Pod的调度进程中。应用场景5：在线离线作业混合部署当前很多业务有波峰和波谷，部署服务时，为了保证服务的性能和稳定性，通常会按照波峰时需要的资源申请，但是波峰的时间可能很短，这样在非波峰时段就有资源浪费。另外，由于在线作业SLA要求较高，为了保证服务的性能和可靠性

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景
出口网络带宽保障 - 云容器引擎 CCE

有如下优点：平衡在线业务与离线业务对出口网络带宽的使用，保证在线业务有足够的网络带宽，在线业务触发阈值时，压缩离线业务带宽使用。在线业务所占用的网络资源较少时，离线业务可使用更多带宽；在线业务所占用的网络资源较多时，降低离线业务资源占用量，从而优先保障在线业务的网络带宽。约束与限制

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > 云原生混部
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

多的知识积累。图1 模型训练环节 Kubeflow诞生于2017年，Kubeflow项目是基于容器和Kubernetes构建，旨在为数据科学家、机器学习工程师、系统运维人员提供面向机器学习业务的敏捷部署、开发、训练、发布和管理平台。它利用了云原生技术的优势，让用户更快速、方便地

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
Volcano调度概述 - 云容器引擎 CCE

支持最小运行Pod数、支持task、支持生命周期管理、支持指定队列、支持优先级调度等。Volcano Job更加适用于机器学习、大数据、科学计算等高性能计算场景。应用扩缩容优先级策略（Balancer与BalancerPolicyTemplate）：开启Volcano应用扩缩

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
CCE是否支持账户余额变动提醒？ - 云容器引擎 CCE

CCE是否支持账户余额变动提醒？系统会以邮件、短信形式给客户发送账户余额变动通知，包括账户余额调整、充值到账、客户在线充值等。父主题：计费类

 帮助中心 > 云容器引擎 CCE > 常见问题 > 计费类
调度概述 - 云容器引擎 CCE
调度概述 - 云容器引擎 CCE

Limit值的弹性限流机制，以降低业务长尾响应时间，可以有效提升时延敏感型业务的服务质量。 CPU Burst弹性限流出口网络带宽保障平衡在线业务与离线业务对出口网络带宽的使用，保证在线业务有足够的网络带宽。出口网络带宽保障父主题：调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度
集群成本管理最佳实践 - 云容器引擎 CCE

业务“潮汐”特性明显，预留资源较多：在线业务具有明显日级别波峰、波谷特性，用户为保证服务的性能和稳定性按照波峰申请资源，集群的大部分资源处于闲置状态。在线和离线作业分布不同集群，资源无法分时复用：用户为在线和离线作业划分不同的K8s集群中，在线业务在波谷时，无法部署离线作业使用这部分资源。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 集群
PodTemplate - 云容器引擎 CCE
PodTemplate - 云容器引擎 CCE

annotations["volcano.sh/qos-level"] -7~7间整数无允许 - 小于0代表低优先级任务，即离线作业，大于等于0代表高优先级任务，即在线作业。 Pod的入口带宽参数名取值范围默认值是否允许修改作用范围 annotations["kubernetes.io/ingress-bandwidth"]

帮助中心 > 云容器引擎 CCE > 配置参考 > Pod
云原生混部概述 - 云容器引擎 CCE

级高的业务SLO。资源分级管控为业务潮汐明显的在线业务间混部、在线和离线业务混部奠定了基础。解决了应用预留资源较多、资源无法分时复用的问题。在线作业与离线作业从业务是否一直在线的角度看，其类型可分为在线作业和离线作业。在线作业：一般运行时间长，服务流量呈周期性，资源存在潮

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > 云原生混部
弹性伸缩概述 - 云容器引擎 CCE

、弹性优化、成本优化的功能。全场景支持，适合在线业务、深度学习、大规模成本算力交付等。节点自动伸缩 CCE突发弹性引擎（对接CCI）将Kubernetes API扩展到无服务器的容器平台（如CCI），无需关心节点资源。适合在线突增流量、CI/CD、大数据作业等场景。 CCE容器实例弹性伸缩到CCI服务

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩
通过负载均衡配置实现会话保持 - 云容器引擎 CCE

务器进行处理。开启会话保持后，负载均衡会把来自同一客户端的访问请求持续分发到同一台后端云服务器上进行处理。例如在大多数需要用户身份认证的在线系统中，一个用户需要与服务器实现多次交互才能完成一次会话。由于多次交互过程中存在连续性，如果不配置会话保持，负载均衡可能会将部分请求分配至

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络
目标集群资源规划 - 云容器引擎 CCE

场景。P系列适合于深度学习，科学计算，CAE等；G系列适合于3D动画渲染，CAD等。仅支持1.11及以上版本集群添加GPU加速型节点。高性能计算型：实例提供具有更稳定、超高性能计算性能的实例，可以用于超高性能计算能力、高吞吐量的工作负载场景，例如科学计算。通用计算增强型：该类

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 迁移 > 将K8s集群迁移到CCE
业务检查 - 云容器引擎 CCE
业务检查 - 云容器引擎 CCE

遍。常见的业务确认方式有：业务界面可用监控平台无异常告警与事件关键应用进程无错误日志 API拨测正常等解决方案若集群升级后您的在线业务有异常，请联系技术支持人员。父主题：升级后验证

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级后验证
工作负载伸缩原理 - 云容器引擎 CCE

满足于CPU和Memory，开发者需要应用自身的业务指标，或者是一些接入层的监控信息，例如：Load Balancer的QPS、网站的实时在线人数等。社区经过思考之后，定义了一套标准的Metrics API，通过聚合API对外提供服务。 metrics.k8s.io：主要提供P

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 工作负载弹性伸缩
节点规格说明 - 云容器引擎 CCE

机器学习、深度学习、训练推理、科学计算、地震分析、计算金融学、渲染、多媒体编解码。 CCE Turbo集群推理加速型 Pi2 NVIDIA T4（GPU直通） 2560 8.1TFLOPS 单精度浮点计算 130INT8 TOPS 260INT4 TOPS 机器学习、深度学习、训练推理、科学计算、地

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点
更新指定的集群 - 云容器引擎 CCE

更新指定的集群功能介绍该API用于更新指定的集群。集群管理的URL格式为：https://Endpoint/uri。其中uri为资源路径，也即API访问的路径。调用方法请参见如何调用API。 URI PUT /api/v3/projects/{project_id}/c

帮助中心 > 云容器引擎 CCE > API参考 > API > 集群管理

总条数： 82

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CCE AI套件（NVIDIA GPU）插件使用DCGM-Exporter监控GPU指标 - 云容器引擎 CCE

调度算法 - 云容器引擎 CCE

按需计费 - 云容器引擎 CCE

动态资源超卖 - 云容器引擎 CCE

高性能调度 - 云容器引擎 CCE

出口网络带宽保障 - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

Volcano调度概述 - 云容器引擎 CCE

CCE是否支持账户余额变动提醒？ - 云容器引擎 CCE

调度概述 - 云容器引擎 CCE

集群成本管理最佳实践 - 云容器引擎 CCE

PodTemplate - 云容器引擎 CCE

云原生混部概述 - 云容器引擎 CCE

弹性伸缩概述 - 云容器引擎 CCE

通过负载均衡配置实现会话保持 - 云容器引擎 CCE

目标集群资源规划 - 云容器引擎 CCE

业务检查 - 云容器引擎 CCE

工作负载伸缩原理 - 云容器引擎 CCE

节点规格说明 - 云容器引擎 CCE

更新指定的集群 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线