搜索_华为云

CCE AI套件（NVIDIA GPU）插件使用DCGM-Exporter监控GPU指标 - 云容器引擎 CCE

DCGM提供了种类丰富的GPU监控指标，功能特性如下： GPU行为监控 GPU配置管理 GPU Policy管理 GPU健康诊断 GPU级别统计和线程级别统计 NVSwitch配置和监控本文基于CCE云原生监控插件和DCGM Exporter实现丰富的GPU观测场景，常用指标

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus 云原生监控插件兼容模式若您已自建Prometheus，且您的Prometheus基于开源，未做深度定制、未与您的监控系统深度整合，建议您卸载自建Prometheus并直接使用云原生监控插件对您的集群进行监控，无需开启“兼容模式”。卸

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
云原生监控插件升级检查异常处理 - 云容器引擎 CCE

手动创建的grafana的服务（service）和路由（ingress）无法直接绑定至新的grafana插件，需要手动修改服务的选择器的配置，请及时修改对应的选择器。方案一：如果当前插件能够升级至3.9.0及以上的版本，请前往“插件中心”页面，单击云原生监控插件的“升级”按钮

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
PVC视图 - 云容器引擎 CCE
PVC视图 - 云容器引擎 CCE

提供了集群中的PVC监控视图，包含PV/PVC的状态、使用率情况。支持以下PVC类型监控：云硬盘类型的PVC（要求volumeMode参数值为Filesystem）支持使用量监控。本地持久卷类型的PVC（要求集群中安装的Everest版本大于等于2.4.41）支持使用量监控。极

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
云原生监控插件版本发布记录 - 云容器引擎 CCE

云原生监控插件版本发布记录表1 云原生监控插件版本记录插件版本支持的集群版本更新特性社区版本 3.12.0 v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 v1.31 适配CCE v1.31集群升级Prometheus版本 2.53

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
为ELB Ingress配置服务器名称指示（SNI） - 云容器引擎 CCE

ELB服务中的证书ID列表，不同ID间使用英文逗号隔开，列表长度大于等于1。列表中的首个ID为服务器证书，其余ID为SNI证书（SNI证书中必须带有域名）。如果无法根据客户端请求的域名查找到对应的SNI证书，则默认返回服务器证书。获取方法：在CCE控制台，单击顶部的“服务列表 >

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 路由（Ingress） > ELB Ingress管理 > ELB Ingress高级配置示例
更新指定的集群 - 云容器引擎 CCE

iptables：社区传统的kube-proxy模式，完全以iptables规则的方式来实现service负载均衡。该方式最主要的问题是在服务多的时候产生太多的iptables规则，非增量式更新会引入一定的时延，大规模情况下有明显的性能问题。 ipvs：主导开发并在社区获得广泛支持的kube-p

帮助中心 > 云容器引擎 CCE > API参考 > API > 集群管理
Prometheus Server视图 - 云容器引擎 CCE

可用于并行发送到远程存储的分片数的最大值最小队列数个可用于并行发送到远程存储的分片数的最小值期望队列数个分片队列期望基于输入样本和输出样本的比率运行的分片数队列容量个用于并行发送到远程存储的队列每个分片的容量挂起中的样本数个用于并行发送到远程存储的队列中每个分片的容量 TSDB当前段

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

基于GPU监控指标的工作负载弹性伸缩配置集群中包含GPU节点时，可通过GPU指标查看节点GPU资源的使用情况，例如GPU利用率、显存使用量等。在获取GPU监控指标后，用户可根据应用的GPU指标配置弹性伸缩策略，在业务波动时自适应调整应用的副本数量。前提条件目标集群已创建，且

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
通过AOM配置自定义告警 - 云容器引擎 CCE

告警方式：选择“直接告警”。行动规则：选择创建行动规则步骤中创建的行动规则。其余参数可按需求配置。本示例中的设置的告警为：当集群中存在节点状态异常时，CCE会上报“节点状态异常”的事件到AOM，AOM根据设置的告警规则，立即触发告警通知，并根据行动规则，通过SMN通知您。图1

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
使用Prometheus监控Master节点组件指标 - 云容器引擎 CCE

通过监控中心查看Master节点组件指标云原生监控中心已支持对Master节点的kube-apiserver组件进行监控，您在集群中开通云原生监控中心后（安装云原生监控插件版本为3.5.0及以上），可以查看仪表盘中的APIServer视图，监控API指标。如需对kube-controller、kube-sched

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
GPU视图 - 云容器引擎 CCE
GPU视图 - 云容器引擎 CCE

百分比每张GPU卡的算力使用率计算公式：显卡上容器算力使用总量/显卡的算力总量 GPU卡-温度摄氏度每张GPU卡的温度 GPU-显存频率赫兹每张GPU卡的显存频率 GPU卡-PCle带宽字节/秒每张GPU卡的PCle带宽指标清单 GPU视图使用的指标清单如下：表2

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
使用PrometheusRules配置普罗监控与告警规则 - 云容器引擎 CCE

使用PrometheusRules配置普罗监控与告警规则 Prometheus具有PrometheusRule的能力，PrometheusRules提供了一种用于监控和警报的规则语言，能够方便用户更好的使用Prometheus查询监控指标，配置基于PromQL的告警规则。当前云原生监控插件仅支持开启本地

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
为什么CCE集群界面的节点磁盘监控看起来不准确？ - 云容器引擎 CCE

为什么CCE集群界面的节点磁盘监控看起来不准确？问题描述： CCE集群界面的某个节点磁盘监控高达80%以上，而进入云监控界面看到的磁盘使用率在40%不到。后面在该节点上排查，发现有一个pvc磁盘使用达到了92%，将这个盘清理后，集群界面的磁盘使用率和云监控使用率一致了。请问集群界面的节点监控是怎么

 帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群运行
对象存储概述 - 云容器引擎 CCE

动创建对象存储和对应的PV对象。适用于无可用的底层存储，需要新创建的场景。计费说明挂载对象存储类型的存储卷时，通过StorageClass自动创建的对象存储默认创建计费模式为“按需计费”。关于对象存储的价格信息，请参见对象存储计费说明。如需使用包周期的对象存储，请使用已有的对象存储进行挂载。

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 对象存储（OBS）
计算配置 - 云容器引擎 CCE
计算配置 - 云容器引擎 CCE

Standard集群：弹性云服务器-虚拟机：基于弹性云服务器部署容器服务。弹性云服务器-物理机：基于擎天架构的服务器部署容器服务。裸金属服务器：基于裸金属服务器部署容器服务，需要挂载本地盘或支持挂载云硬盘。 CCE Turbo集群：弹性云服务器-虚拟机：基于弹性云服务器部署容器服务，仅支持可添加多张弹性网卡的机型。

帮助中心 > 云容器引擎 CCE > 配置参考 > 节点
CCE容器云存储PVC能否感知底层存储故障？ - 云容器引擎 CCE

会根据服务类型自动关联该服务的监控指标，帮助用户实时掌握云服务的各项性能指标，精确掌握云服务的运行情况。建议有存储故障感知诉求的用户配套云监控服务CES的云服务监控能力使用，实现对底层存储的监控和告警通知。父主题：存储管理

 帮助中心 > 云容器引擎 CCE > 常见问题 > 存储管理
Prometheus Agent视图 - 云容器引擎 CCE

Agent是轻量化的容器监控模式，可以收集有关主机和应用程序的指标数据，并将数据上报并存储到AOM或三方监控平台。Prometheus Agent视图展示了Prometheus提供的一些内置指标，可用于监控和度量系统的性能和状态。指标说明 Prometheus Agent视图暴露的指标如下：

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
仪表盘 - 云容器引擎 CCE
仪表盘 - 云容器引擎 CCE

CoreDNS视图 PVC视图 Kubelet视图 Prometheus Server视图 Prometheus Agent视图父主题：监控中心

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
Pod视图 - 云容器引擎 CCE
Pod视图 - 云容器引擎 CCE

从Pod视角呈现Pod维度集群资源、网络、磁盘等监控情况，帮助您详细了解Pod的运行状态。指标说明 Pod视图暴露的指标包括Pod资源指标、Pod网络指标和Pod磁盘指标，具体说明如下：图1 Pod资源指标表1 Pod资源指标说明指标名称单位说明容器数个 Pod中的容器总数运行中容器数个

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘

总条数： 747

上一页
1
2
3
4
5
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CCE AI套件（NVIDIA GPU）插件使用DCGM-Exporter监控GPU指标 - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

云原生监控插件升级检查异常处理 - 云容器引擎 CCE

PVC视图 - 云容器引擎 CCE

云原生监控插件版本发布记录 - 云容器引擎 CCE

为ELB Ingress配置服务器名称指示（SNI） - 云容器引擎 CCE

更新指定的集群 - 云容器引擎 CCE

Prometheus Server视图 - 云容器引擎 CCE

基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

通过AOM配置自定义告警 - 云容器引擎 CCE

使用Prometheus监控Master节点组件指标 - 云容器引擎 CCE

GPU视图 - 云容器引擎 CCE

使用PrometheusRules配置普罗监控与告警规则 - 云容器引擎 CCE

为什么CCE集群界面的节点磁盘监控看起来不准确？ - 云容器引擎 CCE

对象存储概述 - 云容器引擎 CCE

计算配置 - 云容器引擎 CCE

CCE容器云存储PVC能否感知底层存储故障？ - 云容器引擎 CCE

Prometheus Agent视图 - 云容器引擎 CCE

仪表盘 - 云容器引擎 CCE

Pod视图 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线