搜索_华为云

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 Kubernetes已经成为云原生应用编排、管理的事实标准，越来越多的应用选择向Kubernetes迁移。人工智能和机器学习领域天然的包含大量的计算密集型任务，开发者非常愿意基于Kubernetes构建AI平台，充分利用Kubernetes提供的资源管理、应用编排、运维监控能力。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
云容器引擎-成长地图 - 云容器引擎 CCE

rnetes的使用和维护技能。云容器引擎视频指导带您熟悉云容器引擎控制台，手把手与您一起部署容器工作负载。智能客服您好！我是有问必答知识渊博的的智能问答机器人，有问题欢迎随时求助哦！社区求助华为云社区是华为云用户的聚集地。这里有来自容器服务的技术牛人，为您解决技术难题。

帮助中心 > 云容器引擎 CCE > 成长地图
通过告警中心一键配置告警 - 云容器引擎 CCE

Standard集群、CCE Turbo集群开启智能告警中心后，可以进行告警规则的配置和管理。登录CCE控制台。在集群列表页面，单击目标集群名称进入详情页。在左侧导航栏选择“告警中心”，选择“告警规则”页签，在此处进行告警规则的配置和管理。智能告警中心功能会默认生成容器场景下的告警

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
集群视图 - 云容器引擎 CCE
集群视图 - 云容器引擎 CCE

集群视图基于集群的指标和PromQL语句，提供了集群节点、CPU、内存、网络、磁盘等关键资源相关图表，帮助您了解整体集群的资源运行状态。接下来主要从指标说明、指标清单两个部分来进行图表的说明，其中图表中对于数值过大的字节（bytes）会换算为MB、KB、GB等。指标说明集群

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
XGPU视图 - 云容器引擎 CCE
XGPU视图 - 云容器引擎 CCE

XGPU视图 XGPU是虚拟化的GPU设备，从XGPU视图可以在节点、GPU卡、容器等多个角度监控XGPU虚拟化设备的显存、算力分配率，帮助您掌控GPU运行状况。指标说明图1 XGPU资源指标表1 XGPU视图图表说明图表名称单位说明集群-XGPU设备显存使用率百分比

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
主机视图 - 云容器引擎 CCE
主机视图 - 云容器引擎 CCE

主机视图从主机视角出发，监控主机的资源占用与健康状态，查看主机的磁盘、文件系统等常用系统设备指标，帮助您掌控节点运行状况。指标说明主机视图暴露的指标具体说明如下：图1 主机资源指标表1 视图说明图表名称单位说明 CPU使用率百分比每个CPU核的使用率平均负载

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
PVC视图 - 云容器引擎 CCE
PVC视图 - 云容器引擎 CCE

PVC视图提供了集群中的PVC监控视图，包含PV/PVC的状态、使用率情况。支持以下PVC类型监控：云硬盘类型的PVC（要求volumeMode参数值为Filesystem）支持使用量监控。本地持久卷类型的PVC（要求集群中安装的Everest版本大于等于2.4.41）支持使用量监控。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
CoreDNS视图 - 云容器引擎 CCE
CoreDNS视图 - 云容器引擎 CCE

CoreDNS视图提供了负载域名解析的CoreDNS监控视图，包含请求、响应情况，以及缓存状况。指标说明 CoreDNS视图暴露的指标如下：图1 CoreDNS视图指标表1 CoreDNS指标说明指标名称单位说明请求速率个/秒 CoreDNS每秒请求个数请求速率(记录类型)

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
Kubelet视图 - 云容器引擎 CCE
Kubelet视图 - 云容器引擎 CCE

Kubelet视图 Kubelet是运行在集群中每个节点上的代理程序，它提供了一些指标可以更好地了解集群的运行状态。指标说明 Kubelet视图暴露的指标如下：表1 Kubelet图表说明视图名称单位说明运行中Kubelet 个集群运行中的kubelet的数量运行中Pod

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
Pod视图 - 云容器引擎 CCE
Pod视图 - 云容器引擎 CCE

Pod视图从Pod视角呈现Pod维度集群资源、网络、磁盘等监控情况，帮助您详细了解Pod的运行状态。指标说明 Pod视图暴露的指标包括Pod资源指标、Pod网络指标和Pod磁盘指标，具体说明如下：图1 Pod资源指标表1 Pod资源指标说明指标名称单位说明容器数个

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
Node视图 - 云容器引擎 CCE
Node视图 - 云容器引擎 CCE

Node视图从节点视角出发，加入了节点资源、网络、磁盘等关键指标呈现，帮助您掌控节点运行状况。指标说明 Node视图暴露的指标如下：图1 Node资源指标表1 Node资源指标说明指标名称单位说明节点CPU使用率百分比节点CPU使用率 CPURequests水位

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
功能总览 - 云容器引擎 CCE
功能总览 - 云容器引擎 CCE

CCE Turbo集群 CCE Turbo集群是基于云原生基础设施构建的云原生2.0容器引擎服务，具备软硬协同、网络无损、安全可靠、调度智能的优势，为用户提供一站式、高性价比的全新容器服务体验。 CCE Turbo集群提供了面向大规模高性能的场景云原生2.0网络，容器直接从VP

帮助中心 > 云容器引擎 CCE > 功能总览
微服务流量治理 - 云容器引擎 CCE

无需修改代码，即可实现灰度发布、流量治理和流量监控能力。优势开箱即用与云容器引擎无缝对接，一键开启后即可提供非侵入的智能流量治理解决方案。策略化智能路由无需修改代码，即可实现HTTP、TCP等服务连接策略和安全策略。流量治理可视化基于无侵入的监控数据采集，深度整合A

帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景
GPU视图 - 云容器引擎 CCE
GPU视图 - 云容器引擎 CCE

GPU视图 GPU资源指标可以衡量GPU性能和使用情况，包括GPU的利用率、温度、显存等方面的监控数据，帮助您掌控GPU运行状况。指标说明图1 GPU资源指标表1 GPU图表说明图表名称单位说明集群-显存使用率百分比集群的显存使用率计算公式：集群内容器显存使用总量/集群内显存总量

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
GPU故障处理 - 云容器引擎 CCE
GPU故障处理 - 云容器引擎 CCE

GPU驱动或GPU设备存在异常，请根据GPU设备所在的节点类型（ECS或BMS），联系对应的客服进行处理。 GPU设备DBE错误与SBE错误总数过高 GPU驱动或GPU设备存在异常，请根据GPU设备所在的节点类型（ECS或BMS），联系对应的客服进行处理。 GPU设备存在Uncorrectable ECC错误

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
错误码 - 云容器引擎 CCE
错误码 - 云容器引擎 CCE

当调用出错时，HTTP 请求返回一个 4xx 或 5xx 的 HTTP 状态码。返回的消息体中是具体的错误代码及错误信息。在调用方找不到错误原因时，可以联系客服，并提供错误码，以便尽快帮您解决问题。错误响应Body体格式说明当接口调用出错时，会返回错误码及错误信息说明，错误响应的Body体格式如下所示。

帮助中心 > 云容器引擎 CCE > API参考 > 附录
CCE Turbo集群正式发布，敬请购买使用 - 云容器引擎 CCE

发布时间：2021/03/31 CCE Turbo集群是全面基于云原生基础设施构建的云原生2.0的容器引擎服务，具备软硬协同、网络无损、安全可靠、调度智能的优势，为用户提供一站式、高性价比的全新容器服务体验。详情请参见购买CCE集群。父主题：产品变更公告

 帮助中心 > 云容器引擎 CCE > 服务公告 > 产品变更公告
集群网络地址段规划实践 - 云容器引擎 CCE

集群网络地址段规划实践在CCE中创建集群时，您需要根据具体的业务需求规划VPC的数量、子网的数量、容器网段划分和服务网段连通方式。本文将介绍VPC环境下CCE集群里各种地址的作用，以及地址段该如何规划。约束与限制通过搭建VPN方式访问CCE集群，需要注意VPN网络和集群所在的VPC网段、容器使用网段不能冲突。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络
在CCE Turbo集群中使用分布式云资源 - 云容器引擎 CCE

CCE Turbo集群支持管理边缘基础设施（智能边缘小站）的能力。启用分布式支持后，一个集群可以统一管理数据中心和边缘的计算资源，用户可以便捷地根据应用的诉求将其部署在对应的区域。 CCE Turbo集群使用分布式云资源功能需要提前注册并部署智能边缘小站服务。图1 CCE Turbo分布式管理

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 购买集群
自建K8s集群迁移方案概述 - 云容器引擎 CCE

自建K8s集群迁移方案概述操作场景随着容器化技术的发展，越来越多的企业使用容器代替了虚拟机完成应用的运行部署，而Kubernetes的发展让容器化的部署变得简单并且高效。目前许多企业选择自建Kubernetes集群，但是自建集群往往有着沉重的运维负担，需要运维人员自己配置管理

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 迁移 > 将K8s集群迁移到CCE

总条数： 465

上一页
1
2
3
4
5
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

云容器引擎-成长地图 - 云容器引擎 CCE

通过告警中心一键配置告警 - 云容器引擎 CCE

集群视图 - 云容器引擎 CCE

XGPU视图 - 云容器引擎 CCE

主机视图 - 云容器引擎 CCE

PVC视图 - 云容器引擎 CCE

CoreDNS视图 - 云容器引擎 CCE

Kubelet视图 - 云容器引擎 CCE

Pod视图 - 云容器引擎 CCE

Node视图 - 云容器引擎 CCE

功能总览 - 云容器引擎 CCE

微服务流量治理 - 云容器引擎 CCE

GPU视图 - 云容器引擎 CCE

GPU故障处理 - 云容器引擎 CCE

错误码 - 云容器引擎 CCE

CCE Turbo集群正式发布，敬请购买使用 - 云容器引擎 CCE

集群网络地址段规划实践 - 云容器引擎 CCE

在CCE Turbo集群中使用分布式云资源 - 云容器引擎 CCE

自建K8s集群迁移方案概述 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线