搜索_华为云

Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

基于Kubernetes构建一个端到端的AI计算平台是非常复杂和繁琐的过程，它需要处理很多个环节。如图1所示，除了熟知的模型训练环节之外还包括数据收集、预处理、资源管理、特性提取、数据验证、模型的管理、模型发布、监控等环节。对于一个AI算法工程师来讲，如果要做模型训练，就不得不搭建一套AI计算平台，这个过程耗时费力，而且需要很多的知识积累。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
创建守护进程集（DaemonSet） - 云容器引擎 CCE

创建守护进程集（DaemonSet）操作场景云容器引擎（CCE）提供多种类型的容器部署和管理能力，支持对容器工作负载的部署、配置、监控、扩容、升级、卸载、服务发现及负载均衡等特性。其中守护进程集（DaemonSet）可以确保全部（或者某些）节点上仅运行一个Pod实例，当有节点加入集群时，也会为其新增一个

 帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 创建工作负载
使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

ernetes构建AI平台，充分利用Kubernetes提供的资源管理、应用编排、运维监控能力。 Kubernetes存在的问题 Kubeflow在调度环境使用的是Kubernetes的默认调度器。而Kubernetes默认调度器最初主要是为长期运行的服务设计的，对于AI、大数据

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
配置节点故障检测策略 - 云容器引擎 CCE

配置节点故障检测策略节点故障检查功能依赖node-problem-detector（简称：npd），npd是一款集群节点监控插件，插件实例会运行在每个节点上。本文介绍如何开启节点故障检测能力。前提条件集群中已安装CCE节点故障检测插件。开启节点故障检测登录CCE控制台，单击集群名称进入集群。

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维
系统委托说明 - 云容器引擎 CCE

由于CCE在运行中对计算、存储、网络以及监控等各类云服务资源都存在依赖关系，因此当您首次登录CCE控制台时，CCE将自动请求获取当前区域下的云资源权限，从而更好地为您提供服务。服务权限包括：计算类服务 CCE集群创建节点时会关联创建云服务器，因此需要获取访问弹性云服务器、裸金属服务器的权限。存储类服务 CCE

帮助中心 > 云容器引擎 CCE > 用户指南 > 权限
业务检查 - 云容器引擎 CCE
业务检查 - 云容器引擎 CCE

业务不同，验证的方式也有所不同，建议您在升级前确认适合您业务的验证方式，并在升级前后均执行一遍。常见的业务确认方式有：业务界面可用监控平台无异常告警与事件关键应用进程无错误日志 API拨测正常等解决方案若集群升级后您的在线业务有异常，请联系技术支持人员。父主题：升级后验证

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级后验证
健康中心概述 - 云容器引擎 CCE

健康诊断覆盖范围健康诊断覆盖范围如下图所示：图1 健康诊断覆盖范围健康诊断能力项支持开箱即用，可以在不开通监控中心情况下，进行基础的集群健康诊断支持全量检查集群整体运行状况（开通监控中心后），发现集群故障与潜在风险针对诊断结果，智能给出健康评分支持定时巡检，并可视化巡检结果支持查看巡检历史，方便用户分析故障原因

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 健康中心
微服务流量治理 - 云容器引擎 CCE

微服务流量治理应用场景伴随着互联网技术的不断发展，各大企业的系统越来越复杂，传统的系统架构越来越不能满足业务的需求，取而代之的是微服务架构。微服务是将复杂的应用切分为若干服务，每个服务均可以独立开发、部署和伸缩；微服务和容器组合使用，可进一步简化微服务的交付，提升应用的可靠性和可伸缩性。

帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景
设置性能管理配置 - 云容器引擎 CCE

设置性能管理配置操作场景应用性能管理服务（APM）当前支持给JAVA类工作负载提供调用链、拓扑等监控能力。您可为JAVA类工作负载安装APM探针，以提供更精准的问题分析与定位，协助您高效解决应用难题。工作负载创建时和创建后，均可以对JAVA类工作负载监控进行设置。如果您已经使用CC

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 配置工作负载
CCE容器网络扩展指标 - 云容器引擎 CCE

用户可以按照上述格式对监控任务进行创建、修改、及删除，当前仅支持最多10个监控任务的创建，且多个监控任务匹配到同一个监控后端时，每一个监控后端将会产生监控任务数量的监控指标。修改或删除监控任务，都将导致丢失原有监控任务所采集的监控数据，请谨慎操作。用户卸载插件后，用户之前配置的监控任务Mo

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
守护进程集（DaemonSet） - 云容器引擎 CCE

守护进程集（DaemonSet） DaemonSet（守护进程集）在集群的每个节点上运行一个Pod，且保证只有一个Pod，非常适合一些系统层面的应用，例如日志收集、资源监控等，这类应用需要每个节点都运行，且不需要太多实例，一个比较好的例子就是Kubernetes的kube-proxy。 DaemonSet跟节

 帮助中心 > 云容器引擎 CCE > Kubernetes基础知识 > Pod的编排与调度
节点迁移 - 云容器引擎 CCE
节点迁移 - 云容器引擎 CCE

DEC集群和非DEC集群间不支持互迁。开启IPv6开关和未开启IPv6开关的集群间不支持互迁。只支持迁移到目标集群的默认节点池内。 CCE Turbo集群下弹性云服务器-物理机类型节点不支持迁移。调用方法请参见如何调用API。 URI PUT /api/v3/projects/{project_id

帮助中心 > 云容器引擎 CCE > API参考 > API > 节点管理
纳管节点 - 云容器引擎 CCE
纳管节点 - 云容器引擎 CCE

续填写其他参数，详情请参见纳管节点至节点池。节点规格单击添加已有云服务器，选择要纳管的服务器。可以选择多台云服务器批量纳管，但批量纳管仅支持添加相同规格、相同可用区、相同数据盘配置的云服务器。如果云服务器有多块数据盘，需要选择其中一块作为供容器运行时和Kubelet组件使用。

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点
CCE事件列表 - 云容器引擎 CCE
CCE事件列表 - 云容器引擎 CCE

节点文件系统只读 FilesystemIsReadOnly 次要检查节点文件系统是否只读。 Node 节点ntp服务故障 NTPIsDown 次要检查节点NTP服务是否正常。 Node 节点卸载失败 NodeUninstallFailed 次要检查节点卸载是否成功。 Node

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
成本计算模型 - 云容器引擎 CCE

成本计算模型工作负载成本计算原理工作负载成本是由Pod成本聚合而成。 Pod成本：使用监控指标和实际账单作为输入，通过CPU、内存使用量占整体节点资源比例计算出来的成本，结合Pod关联PVC存储的成本。计算过程中，Pod的使用量为当前采样时刻下申请量（Request）和实际使用量（Real

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生成本治理 > 成本洞察
云容器引擎（CCE）和应用管理与运维平台（ServiceStage）的区别是什么？ - 云容器引擎 CCE

理、应用服务网格、Helm应用模板、插件管理、应用调度、监控与运维等容器全栈能力，为您提供一站式容器平台服务。借助云容器引擎，您可以在华为云上轻松部署、管理和扩展容器化应用程序。应用管理与运维平台（ServiceStage） ServiceStage应用管理与运维平台是一个应用

 帮助中心 > 云容器引擎 CCE > 常见问题 > 相关服务
云原生观测委托权限说明 - 云容器引擎 CCE

云原生观测委托权限说明由于云原生观测相关的功能在运行中对监控、告警、通知服务等各类云服务资源都存在依赖关系，因此当您首次使用云原生观测相关的功能时，系统将自动请求获取当前区域下的云资源权限，从而更好地为您提供服务。为了最小化授权，CCE服务进行了一次权限细粒度化改造，将由系统策略为粒度的

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测
Kubernetes Dashboard - 云容器引擎 CCE

Kubernetes Dashboard 插件介绍 Kubernetes Dashboard是一个旨在为Kubernetes世界带来通用监控和操作Web界面的项目，集合了命令行可以操作的所有命令。字段说明表1 参数描述参数是否必选参数类型描述 basic 否 object

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
单集群视角的成本洞察 - 云容器引擎 CCE

已开通成本洞察功能约束与限制由于实际账单的获取存在两天时间延迟，开通成本洞察后，成本洞察成本数据会延迟2天显示。使用成本洞察期间，需要保证云原生监控插件运行正常，否则影响成本洞察中命名空间、工作负载、节点池等相关视图的呈现。操作入口登录CCE控制台，单击集群名称进入集群。单击左侧导航栏中的“云原生成本治理

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生成本治理 > 成本洞察
云原生观测最佳实践 - 云容器引擎 CCE

云原生观测最佳实践云原生监控插件兼容自建Prometheus 使用云原生监控插件监控自定义指标使用AOM监控自定义指标使用PrometheusRules配置普罗监控与告警规则使用Prometheus监控Master节点组件指标监控NGINX Ingress控制器指标监控CCE Turbo集群容器网络扩展指标

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测

总条数： 1014

上一页
1
...
4
5
6
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Kubeflow部署 - 云容器引擎 CCE

创建守护进程集（DaemonSet） - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

配置节点故障检测策略 - 云容器引擎 CCE

系统委托说明 - 云容器引擎 CCE

业务检查 - 云容器引擎 CCE

健康中心概述 - 云容器引擎 CCE

微服务流量治理 - 云容器引擎 CCE

设置性能管理配置 - 云容器引擎 CCE

CCE容器网络扩展指标 - 云容器引擎 CCE

守护进程集（DaemonSet） - 云容器引擎 CCE

节点迁移 - 云容器引擎 CCE

纳管节点 - 云容器引擎 CCE

CCE事件列表 - 云容器引擎 CCE

成本计算模型 - 云容器引擎 CCE

云容器引擎（CCE）和应用管理与运维平台（ServiceStage）的区别是什么？ - 云容器引擎 CCE

云原生观测委托权限说明 - 云容器引擎 CCE

Kubernetes Dashboard - 云容器引擎 CCE

单集群视角的成本洞察 - 云容器引擎 CCE

云原生观测最佳实践 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线