搜索_华为云

守护进程集（DaemonSet） - 云容器引擎 CCE

守护进程集（DaemonSet） DaemonSet（守护进程集）在集群的每个节点上运行一个Pod，且保证只有一个Pod，非常适合一些系统层面的应用，例如日志收集、资源监控等，这类应用需要每个节点都运行，且不需要太多实例，一个比较好的例子就是Kubernetes的kube-proxy。 DaemonSet跟节

 帮助中心 > 云容器引擎 CCE > Kubernetes基础知识 > Pod的编排与调度
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

它需要处理很多个环节。如图1所示，除了熟知的模型训练环节之外还包括数据收集、预处理、资源管理、特性提取、数据验证、模型的管理、模型发布、监控等环节。对于一个AI算法工程师来讲，如果要做模型训练，就不得不搭建一套AI计算平台，这个过程耗时费力，而且需要很多的知识积累。图1 模型训练环节

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
存储概述 - 云容器引擎 CCE
存储概述 - 云容器引擎 CCE

根据具体的使用场景，您可以选择合适的本地存储类型，详情请参见本地存储对比。 Kubernetes资源对象 ConfigMap和Secret是集群中创建的资源，属于比较特殊的存储类型，由Kubernetes API服务器上的tmpfs（基于RAM的文件系统）提供存储。 ConfigMap一般用于给Pod注入配置数据。

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储
CCE事件列表 - 云容器引擎 CCE
CCE事件列表 - 云容器引擎 CCE

CCE事件列表在集群运行过程中，CCE会上报一系列事件至AOM，您可以根据自身需求添加事件类告警，监控集群数据面和控制面组件的健康状态，及时发现和解决问题，保证集群的稳定性和可靠性。集群数据面事件：集群运行过程中与用户操作相关的事件，包括工作负载、网络、节点、存储、弹性伸缩等事件。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
单部门视角的成本洞察 - 云容器引擎 CCE

已完成部门配置约束与限制由于实际账单的获取存在两天时间延迟，开通成本洞察后，成本洞察成本数据会延迟2天显示。使用成本洞察期间，要保证云原生监控插件运行正常，否则影响成本洞察中命名空间、工作负载、节点池等相关视图的呈现。操作入口登录CCE控制台，单击左侧导航栏中的“云原生成本治理”。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生成本治理 > 成本洞察
系统委托说明 - 云容器引擎 CCE

网络类服务 CCE支持集群下容器发布为对外访问的服务，因此需要获取访问虚拟私有云、弹性负载均衡等服务的权限。容器与监控类服务 CCE集群下容器支持镜像拉取、监控和日志分析等功能，需要获取访问容器镜像、应用管理等服务的权限。当您同意授权后，CCE将在IAM中自动创建账号委托，将

 帮助中心 > 云容器引擎 CCE > 用户指南 > 权限
设置标签与注解 - 云容器引擎 CCE

io/custom-endpoints AOM监控指标上报参数，可将指定指标上报是AOM服务。具体使用请参见使用AOM监控自定义指标。 - prometheus.io/scrape Prometheus指标上报参数，值为true表示当前负载开启上报。具体使用请参见使用云原生监控插件监控自定义指标。 - prometheus

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 配置工作负载
CCE最佳实践汇总 - 云容器引擎 CCE

y的安全配置建议监控相关使用Prometheus监控多个集群使用dcgm-exporter监控GPU指标将Prometheus监控数据上报至第三方监控平台通过PromQL语句查询Prometheus数据使用云原生监控插件监控自定义指标使用AOM监控自定义指标使用P

帮助中心 > 云容器引擎 CCE > 最佳实践
诊断项及修复方案 - 云容器引擎 CCE

云原生监控插件状态否同上云原生监控插件状态。 prometheus工作负载近24小时CPU使用率最大值是否超过80% 是云原生监控插件主要提供了集群运维监控的能力，资源使用率过高会导致存在过载风险，影响集群监控能力。可前往“监控中心 > 工作负载”监控中查看prometheus

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 健康中心
工作负载最佳实践 - 云容器引擎 CCE

在CCE集群中使用工作负载Identity的安全配置建议工作负载指标监控实践使用Prometheus监控多个集群使用dcgm-exporter监控GPU指标将Prometheus监控数据上报至第三方监控平台通过PromQL语句查询Prometheus数据工作负载弹性伸缩实践

 帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载
工作负载异常：实例驱逐异常（Evicted） - 云容器引擎 CCE

可用区不健康。 large-cluster-size-threshold：集群的大规模阈值，默认为50，当集群节点数量超过该阈值时认为集群属于大规模集群。大规模集群的可用区节点宕机数目超过55%时，则将排空节点速率降为0.01；假如是小规模集群，则将速率直接降为0，即停止驱逐节点上的Pod。

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
插件概述 - 云容器引擎 CCE
插件概述 - 云容器引擎 CCE

云原生可观测性插件插件名称插件简介云原生监控插件云原生监控插件包含Prometheus-operator和Prometheus组件，提供简单易用的端到端Kubernetes集群监控能力。使用云原生监控插件可将监控数据与监控中心对接，在监控中心控制台查看监控数据，配置告警等。云原生日志采集插件

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件
CCE节点上监听的端口列表 - 云容器引擎 CCE

kubelet健康检查端口 10250 TCP kubelet服务端口，提供节点上工作负载的监控信息和容器的访问通道 10255 TCP kubelet只读端口，提供节点上工作负载的监控信息动态端口（与宿主机限制的范围有关，比如内核参数 net.ipv4.ip_local_port_range）

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
开通成本洞察 - 云容器引擎 CCE

开通Region视角的成本洞察开通单集群视角成本洞察开通成本洞察需要安装云原生监控插件，插件采集的监控指标将上报至AOM实例，AOM针对基础指标免费，自定义指标由AOM服务收费，具体请参考价格详情。成本洞察能力使用的监控指标均为基础指标。开通成本洞察会在“华北-北京四”区域创建一个OBS

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生成本治理 > 成本洞察
容器应用部署上云CheckList - 云容器引擎 CCE

云容器引擎提供多维度的监控和告警功能，配置监控告警，以便于异常时及时收到告警并进行故障定位。云监控服务AOM：CCE默认的基础资源监控，覆盖详细的容器相关指标，并提供告警配置能力。开源Prometheus：面向云原生应用程序的开源监控工具，并集成独立的告警系统，提供更高自由度的监控告警配置。

帮助中心 > 云容器引擎 CCE > 最佳实践
GPU调度 - 云容器引擎 CCE
GPU调度 - 云容器引擎 CCE

GPU调度 GPU节点驱动版本使用Kubernetes默认GPU调度 GPU虚拟化监控GPU资源指标基于GPU监控指标的工作负载弹性伸缩配置 GPU虚拟化节点弹性伸缩配置 GPU故障处理父主题：调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度
CCE容器网络扩展指标插件版本发布记录 - 云容器引擎 CCE

27 v1.28 v1.29 支持普通容器Pod粒度的UDP、TCP drop、TCP connect fail监控支持普通容器flow粒度的UDP、TCP drop监控支持HCE 2.0 x86和HCE 2.0 ARM 支持CCE v1.29集群 1.3.10 v1.23 v1

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
基本概念 - 云容器引擎 CCE
基本概念 - 云容器引擎 CCE

tion Controllers和Deployments等，这意味着它们属于某一个命名空间（默认是default）。但仍有一部分资源是集群级别的，例如Node、PersistentVolumes等，它们不属于任何命名空间，为所有命名空间中的资源提供服务。服务（Service）

帮助中心 > 云容器引擎 CCE > Kubernetes基础知识
什么是云容器引擎 - 云容器引擎 CCE

服务治理：深度集成应用服务网格，提供开箱即用的应用服务网格流量治理能力，用户无需修改代码，即可实现灰度发布、流量治理和流量监控能力。容器运维：深度集成容器智能分析，可实时监控应用及资源，支持采集、管理、分析日志，采集各项指标及事件并提供一键开启的告警能力。扩展插件市场：提供了多种类型的

 帮助中心 > 云容器引擎 CCE > 产品介绍
创建使用自定义指标的HPA策略 - 云容器引擎 CCE

步骤一：安装云原生监控插件登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”。在“插件中心”页面右侧找到云原生监控插件，单击“安装”。建议您关注以下配置，其他配置可按需进行设置。详情请参见云原生监控插件。数据存储配置：必选本地数据存储，可选监控数据是否对接AOM或三方监控平台。

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 工作负载弹性伸缩

总条数： 273

上一页
1
...
5
6
7
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

守护进程集（DaemonSet） - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

存储概述 - 云容器引擎 CCE

CCE事件列表 - 云容器引擎 CCE

单部门视角的成本洞察 - 云容器引擎 CCE

系统委托说明 - 云容器引擎 CCE

设置标签与注解 - 云容器引擎 CCE

CCE最佳实践汇总 - 云容器引擎 CCE

诊断项及修复方案 - 云容器引擎 CCE

工作负载最佳实践 - 云容器引擎 CCE

工作负载异常：实例驱逐异常（Evicted） - 云容器引擎 CCE

插件概述 - 云容器引擎 CCE

CCE节点上监听的端口列表 - 云容器引擎 CCE

开通成本洞察 - 云容器引擎 CCE

容器应用部署上云CheckList - 云容器引擎 CCE

GPU调度 - 云容器引擎 CCE

CCE容器网络扩展指标插件版本发布记录 - 云容器引擎 CCE

基本概念 - 云容器引擎 CCE

什么是云容器引擎 - 云容器引擎 CCE

创建使用自定义指标的HPA策略 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线