搜索_华为云

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 Kubernetes已经成为云原生应用编排、管理的事实标准，越来越多的应用选择向Kubernetes迁移。人工智能和机器学习领域天然的包含大量的计算密集型任务，开发者非常愿意基于Kubernetes构建AI平台，充分利用

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
认证鉴权 - 云容器引擎 CCE
认证鉴权 - 云容器引擎 CCE

认证鉴权调用接口有如下两种认证方式，您可以选择其中一种进行认证鉴权。 Token认证：通过Token认证调用请求。 AK/SK认证：通过AK（Access Key ID）/SK（Secret Access Key）加密调用请求。推荐使用AK/SK认证，其安全性比Token认证要高。

帮助中心 > 云容器引擎 CCE > API参考 > 如何调用API
获取集群升级相关信息 - 云容器引擎 CCE

获取集群升级相关信息功能介绍获取集群升级相关信息调用方法请参见如何调用API。 URI GET /api/v3/projects/{project_id}/clusters/{cluster_id}/upgradeinfo 表1 路径参数参数是否必选参数类型描述 project_id

帮助中心 > 云容器引擎 CCE > API参考 > API > 集群升级
HTTPS类型负载均衡证书一致性检查异常处理 - 云容器引擎 CCE

HTTPS类型负载均衡证书一致性检查异常处理检查项内容检查HTTPS类型负载均衡所使用的证书，是否在ELB服务侧被修改。解决方案该问题的出现，一般是由于用户在CCE中创建HTTPS类型Ingress后，直接在ELB证书管理功能中修改了Ingress引用的证书，导致CCE集

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型 - 云容器引擎 CCE

1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型在v1.15.11-r1之后版本的集群中，CSI Everest插件已接管fuxi Flexvolume（即storage-driver插件）容器存储的所有功能，建议将对fuxi Flexvolume的使用切换CSI

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储管理-Flexvolume（已弃用）
1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型 - 云容器引擎 CCE

1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型在v1.15.11-r1之后版本的集群中，CSI Everest插件已接管fuxi Flexvolume（即storage-driver插件）容器存储的所有功能，建议将对fuxi Flexvolume的使用切换CSI

帮助中心 > 云容器引擎 CCE > 最佳实践 > 存储
续费概述 - 云容器引擎 CCE
续费概述 - 云容器引擎 CCE

续费概述续费简介包年/包月的集群或节点到期后会影响服务正常运行。如果您想继续使用，需要在指定的时间内为集群或节点进行续费，否则集群及节点等资源会自动释放，数据丢失且不可恢复。续费操作仅适用于包年/包月的集群或节点，按需计费的资源不需要续费，只需要保证账户余额充足即可。包年

 帮助中心 > 云容器引擎 CCE > 计费说明 > 续费
公平调度（DRF） - 云容器引擎 CCE

公平调度（DRF） DRF（Dominant Resource Fairness）是主资源公平调度策略，应用于大批量提交AI训练和大数据作业的场景，可增强集群业务的吞吐量，整体缩短业务执行时间，提高训练性能。前提条件已创建v1.19及以上版本的集群，详情请参见购买Standard/Turbo集群。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > AI任务性能增强调度
全面修复Kubernetes权限许可和访问控制漏洞公告（CVE-2018-1002105） - 云容器引擎 CCE

全面修复Kubernetes权限许可和访问控制漏洞公告（CVE-2018-1002105）漏洞详情近日，Kubernetes社区发现安全漏洞CVE-2018-1002105。通过伪造请求，Kubernetes用户可以在已建立的API Server连接上提权访问后端服务，华为云容器服务已在第一时间完成全面修复。

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
更新AddonInstance - 云容器引擎 CCE

更新AddonInstance 功能介绍更新插件实例的功能。调用方法请参见如何调用API。 URI PUT /api/v3/addons/{id} 表1 路径参数参数是否必选参数类型描述 id 是 String 插件实例id 请求参数表2 请求Header参数参数

 帮助中心 > 云容器引擎 CCE > API参考 > API > 插件管理
创建AddonInstance - 云容器引擎 CCE

创建AddonInstance 功能介绍根据提供的插件模板，安装插件实例。调用方法请参见如何调用API。 URI POST /api/v3/addons 请求参数表1 请求Header参数参数是否必选参数类型描述 Content-Type 是 String 参数解释：

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件管理
集群升级后确认 - 云容器引擎 CCE

集群升级后确认功能介绍集群升级后确认，该接口建议配合Console使用，主要用于升级步骤完成后，客户确认集群状态和业务正常后做反馈。调用方法请参见如何调用API。 URI POST /api/v3/projects/{project_id}/clusters/{clust

帮助中心 > 云容器引擎 CCE > API参考 > API > 集群升级
获取集群升级路径 - 云容器引擎 CCE

获取集群升级路径功能介绍获取集群升级路径调用方法请参见如何调用API。 URI GET /api/v3/clusterupgradepaths 请求参数表1 请求Header参数参数是否必选参数类型描述 Content-Type 是 String 参数解释：消息体的类型（格式）

帮助中心 > 云容器引擎 CCE > API参考 > API > 集群升级
成本计算模型 - 云容器引擎 CCE

成本计算模型工作负载成本计算原理工作负载成本是由Pod成本聚合而成。 Pod成本：使用监控指标和实际账单作为输入，通过CPU、内存使用量占整体节点资源比例计算出来的成本，结合Pod关联PVC存储的成本。计算过程中，Pod的使用量为当前采样时刻下申请量（Request）和实际使用量（Real

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生成本治理 > 成本洞察
设置容器健康检查 - 云容器引擎 CCE

设置容器健康检查操作场景健康检查是指容器运行过程中，根据用户需要，定时检查容器健康状况。若不配置健康检查，如果容器内应用程序异常，Pod将无法感知，也不会自动重启去恢复。最终导致虽然Pod状态显示正常，但Pod中的应用程序异常的情况。 Kubernetes提供了三种健康检查的探针：

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 配置工作负载
Pod接口ExtendPathMode: PodUID如何与社区client-go兼容？ - 云容器引擎 CCE

Pod接口ExtendPathMode: PodUID如何与社区client-go兼容？使用场景社区Pod结构体中没有ExtendPathMode，用户使用client-go调用创建pod或deployment的API接口时，创建的pod中没有ExtendPathMode。为

 帮助中心 > 云容器引擎 CCE > 常见问题 > 存储管理
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

Kubeflow部署 Kubeflow的诞生背景基于Kubernetes构建一个端到端的AI计算平台是非常复杂和繁琐的过程，它需要处理很多个环节。如图1所示，除了熟知的模型训练环节之外还包括数据收集、预处理、资源管理、特性提取、数据验证、模型的管理、模型发布、监控等环节。对于一

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
NGINX Ingress控制器插件升级导致集群内Nginx类型的Ingress路由访问异常 - 云容器引擎 CCE

NGINX Ingress控制器插件升级导致集群内Nginx类型的Ingress路由访问异常问题现象集群中存在未指定Ingress类型（annotations中未添加kubernetes.io/ingress.class: nginx）的Nginx Ingress路由，NGINX

帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理 > 网络异常问题排查
CCE节点故障检测 - 云容器引擎 CCE

CCE节点故障检测插件介绍 CCE节点故障检测插件（node-problem-detector，简称NPD）是一款监控集群节点异常事件的插件，以及对接第三方监控平台功能的组件。它是一个在每个节点上运行的守护程序，可从不同的守护进程中搜集节点问题并将其报告给apiserver。n

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
设置容忍策略 - 云容器引擎 CCE

设置容忍策略容忍度（Toleration）允许调度器将Pod调度至带有对应污点的节点上。容忍度需要和节点污点相互配合，每个节点上都可以拥有一个或多个污点，对于未设置容忍度的Pod，调度器会根据节点上的污点效果进行选择性调度，可以用来避免Pod被分配到不合适的节点上。更多关于容忍度的使用示例请参见污点和容忍度。

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 配置工作负载

总条数： 815

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

认证鉴权 - 云容器引擎 CCE

获取集群升级相关信息 - 云容器引擎 CCE

HTTPS类型负载均衡证书一致性检查异常处理 - 云容器引擎 CCE

1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型 - 云容器引擎 CCE

1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型 - 云容器引擎 CCE

续费概述 - 云容器引擎 CCE

公平调度（DRF） - 云容器引擎 CCE

全面修复Kubernetes权限许可和访问控制漏洞公告（CVE-2018-1002105） - 云容器引擎 CCE

更新AddonInstance - 云容器引擎 CCE

创建AddonInstance - 云容器引擎 CCE

集群升级后确认 - 云容器引擎 CCE

获取集群升级路径 - 云容器引擎 CCE

成本计算模型 - 云容器引擎 CCE

设置容器健康检查 - 云容器引擎 CCE

Pod接口ExtendPathMode: PodUID如何与社区client-go兼容？ - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

NGINX Ingress控制器插件升级导致集群内Nginx类型的Ingress路由访问异常 - 云容器引擎 CCE

CCE节点故障检测 - 云容器引擎 CCE

设置容忍策略 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线