搜索_华为云

Container配置 - 云容器引擎 CCE
Container配置 - 云容器引擎 CCE

Container配置容器名称参数名取值范围默认值是否允许修改作用范围 name 无无允许 - 镜像名称参数名取值范围默认值是否允许修改作用范围 image 无无允许 - 更新策略参数名取值范围默认值是否允许修改作用范围 imagePullPolicy

帮助中心 > 云容器引擎 CCE > 配置参考 > Pod
基于Prometheus指标的弹性伸缩实践 - 云容器引擎 CCE

步骤一：安装云原生监控插件登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”。在“插件中心”页面右侧找到云原生监控插件，单击“安装”。建议您关注以下配置，其他配置可按需进行设置。详情请参见云原生监控插件。本地数据存储：使用本地存储监控数据，监控数据可选择是否上报至AOM或三方监控平台。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 弹性伸缩
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）插件介绍 CCE AI套件（NVIDIA GPU）插件是支持在容器中使用GPU显卡的设备管理插件，集群中使用GPU节点时必须安装本插件。字段说明表1 参数描述参数是否必选参数类型描述 basic 是 object 插件基础配置参数。

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

基于Kubernetes构建一个端到端的AI计算平台是非常复杂和繁琐的过程，它需要处理很多个环节。如图1所示，除了熟知的模型训练环节之外还包括数据收集、预处理、资源管理、特性提取、数据验证、模型的管理、模型发布、监控等环节。对于一个AI算法工程师来讲，如果要做模型训练，就不得不搭建一套AI计算平台，这个过程耗时费力，而且需要很多的知识积累。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
CCE AI套件（Ascend NPU） - 云容器引擎 CCE

container_path 否 String 容器里用于挂载Hiai library的路径默认值："/usr/local/HiAI_unused" host_path 否 String 主机上包含Hiai library的路径默认值："/usr/local/HiAI_unused"

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
通过CCE配置自定义告警 - 云容器引擎 CCE

(sum(container_memory_working_set_bytes{image!="", container!="POD",namespace="kube-system",container="coredns"}) BY (cluster_name, node,container

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
健康中心概述 - 云容器引擎 CCE

健康诊断覆盖范围如下图所示：图1 健康诊断覆盖范围健康诊断能力项支持开箱即用，可以在不开通监控中心情况下，进行基础的集群健康诊断支持全量检查集群整体运行状况（开通监控中心后），发现集群故障与潜在风险针对诊断结果，智能给出健康评分支持定时巡检，并可视化巡检结果支持查看巡检历史，方便用户分析故障原因

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 健康中心
计费相关FAQ - 云容器引擎 CCE
计费相关FAQ - 云容器引擎 CCE

计费相关FAQ 索引可观测性（监控中心、日志中心、告警中心）如何收费？为什么关闭日志中心后还有收费产生？可观测性（监控中心、日志中心、告警中心）如何收费？免费场景监控中心自身免费使用，监控中心所使用的指标都上报并存储在AOM服务，其中在AOM范畴内的基础指标不收费，存储

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测FAQ
CCE AI套件（Ascend NPU）版本发布记录 - 云容器引擎 CCE

CCE AI套件（Ascend NPU）版本发布记录表1 CCE AI套件（Ascend NPU）插件版本记录插件版本支持的集群版本更新特性 2.1.46 v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 v1.31 支持CCE v1.31集群

 帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
AI任务性能增强调度 - 云容器引擎 CCE

AI任务性能增强调度公平调度（DRF）组调度（Gang）父主题： Volcano调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
CCE AI套件（NVIDIA GPU）版本发布记录 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）版本发布记录表1 CCE AI套件（NVIDIA GPU）版本记录插件版本支持的集群版本更新特性 2.7.42 v1.28 v1.29 v1.30 v1.31 新增NVIDIA 535.216.03驱动，支持XGPU特性 2.7.41

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
Prometheus（停止维护） - 云容器引擎 CCE

Prometheus（停止维护）插件简介 Prometheus是一套开源的系统监控报警框架。它启发于Google的borgmon监控系统，由工作在SoundCloud的Google前员工在2012年创建，作为社区开源项目进行开发，并于2015年正式发布。2016年，Prometheus正式加入Cloud

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
设置性能管理配置 - 云容器引擎 CCE

应用性能管理服务（APM）当前支持给JAVA类工作负载提供调用链、拓扑等监控能力。您可为JAVA类工作负载安装APM探针，以提供更精准的问题分析与定位，协助您高效解决应用难题。工作负载创建时和创建后，均可以对JAVA类工作负载监控进行设置。如果您已经使用CCE部署了容器应用，您需要应用性

 帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 配置工作负载
CCE节点故障检测 - 云容器引擎 CCE

CCE节点故障检测插件介绍 CCE节点故障检测插件（node-problem-detector，简称NPD）是一款监控集群节点异常事件的插件，以及对接第三方监控平台功能的组件。它是一个在每个节点上运行的守护程序，可从不同的守护进程中搜集节点问题并将其报告给apiserver。n

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
CCE节点故障检测 - 云容器引擎 CCE

FrequentDockerRestart 通过定期回溯系统日志，检查容器运行时Docker是否频繁重启 Containerd频繁重启 FrequentContainerdRestart 通过定期回溯系统日志，检查容器运行时Containerd是否频繁重启 Kubelet服务异常 KubeletProblem 检查关键组件Kubelet的运行状态

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
功能总览 - 云容器引擎 CCE
功能总览 - 云容器引擎 CCE

Kubelet、Kube-proxy 、Container Runtime等。在云容器引擎CCE中，主要采用高性能的弹性云服务器ECS或裸金属服务器BMS作为节点来构建高可用的Kubernetes集群。 CCE提供的节点相关功能包括：购买节点、纳管已有节点到集群、登录节点、节点监控、管理节点标签、同步节点信息、重置节点、删除节点、节点关机等。

帮助中心 > 云容器引擎 CCE > 功能总览
Grafana - 云容器引擎 CCE
Grafana - 云容器引擎 CCE

Grafana 插件简介 Grafana是一款开源的数据可视化和监控平台，可以为您提供丰富的图表和面板，用于实时监控、分析和可视化各种指标和数据源。安装插件登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”，在右侧找到Grafana，单击“安装”。设置插件

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
Containerd Pod重启风险检查异常处理 - 云容器引擎 CCE

Containerd Pod重启风险检查异常处理检查项内容检查当前集群内使用containerd的节点在升级containerd组件时，节点上运行的业务容器是否可能发生重启，造成业务影响。解决方案检测到您的节点上的containerd服务存在重启风险；请确保在业务影响可控

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
在CCE Turbo集群中使用分布式云资源 - 云容器引擎 CCE

CCE Turbo集群支持管理边缘基础设施（智能边缘小站）的能力。启用分布式支持后，一个集群可以统一管理数据中心和边缘的计算资源，用户可以便捷地根据应用的诉求将其部署在对应的区域。 CCE Turbo集群使用分布式云资源功能需要提前注册并部署智能边缘小站服务。图1 CCE Turbo分布式管理

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 购买集群
微服务流量治理 - 云容器引擎 CCE

即可实现灰度发布、流量治理和流量监控能力。优势开箱即用与云容器引擎无缝对接，一键开启后即可提供非侵入的智能流量治理解决方案。策略化智能路由无需修改代码，即可实现HTTP、TCP等服务连接策略和安全策略。流量治理可视化基于无侵入的监控数据采集，深度整合APM能力，提供

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景

总条数： 716

上一页
1
2
3
4
5
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Container配置 - 云容器引擎 CCE

基于Prometheus指标的弹性伸缩实践 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

CCE AI套件（Ascend NPU） - 云容器引擎 CCE

通过CCE配置自定义告警 - 云容器引擎 CCE

健康中心概述 - 云容器引擎 CCE

计费相关FAQ - 云容器引擎 CCE

CCE AI套件（Ascend NPU）版本发布记录 - 云容器引擎 CCE

AI任务性能增强调度 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）版本发布记录 - 云容器引擎 CCE

Prometheus（停止维护） - 云容器引擎 CCE

设置性能管理配置 - 云容器引擎 CCE

CCE节点故障检测 - 云容器引擎 CCE

CCE节点故障检测 - 云容器引擎 CCE

功能总览 - 云容器引擎 CCE

Grafana - 云容器引擎 CCE

Containerd Pod重启风险检查异常处理 - 云容器引擎 CCE

在CCE Turbo集群中使用分布式云资源 - 云容器引擎 CCE

微服务流量治理 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线