搜索_华为云

监控运维配置 - 云容器引擎 CCE

监控运维配置 CCE为您提供监控应用及资源的能力，支持采集各项指标及事件等数据以分析应用健康状态，您可以通过“配置中心 > 监控运维配置”统一调整监控运维参数。您需要开通监控中心，以使用监控运维配置的所有功能。监控配置采集配置系统预置采集：可视化管理云原生监控插件的监控采集任务。详情请参见管理监控采集任务。

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心
监控GPU资源指标 - 云容器引擎 CCE

Targets”，可以查看到Prometheus监控了哪些目标。图2 查看监控目标监控GPU指标创建一个使用GPU的工作负载，等工作负载正常运行后，访问Prometheus，在“Graph”页面中，查看GPU指标。图3 查看GPU监控指标表1 GPU基础监控指标类型指标

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致问题现象容器监控的内存使用率与实际弹性伸缩现象不一致，例如容器内存使用率在界面上显示为40%左右，而HPA设置缩容阈值为70%，但界面上显示的内存使用率低于HPA阈值后并没有发生缩容。问题根因界面上显示的容器内存使用率与HPA弹

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 监控日志
云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus 云原生监控插件兼容模式若您已自建Prometheus，且您的Prometheus基于开源，未做深度定制、未与您的监控系统深度整合，建议您卸载自建Prometheus并直接使用云原生监控插件对您的集群进行监控，无需开启“兼容模式”。卸

 帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 可观测性最佳实践
基于ELB监控指标的弹性伸缩实践 - 云容器引擎 CCE

对接Prometheus Prometheus收集到监控数据后，需要将Prometheus的数据转换成Kubernetes metric api提供给HPA controller使用，这样HPA controller就能根据监控数据进行弹性伸缩。本示例中需要监控工作负载相关联的ELB指标，因此目

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 弹性伸缩
通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

通过控制台获取华为云Prometheus监控数据在集群中安装云原生监控插件，采集Prometheus监控数据。登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”。在“插件中心”页面右侧找到云原生监控插件，单击“安装”。建议您关注以下配置，其他配置可按需进行设置。详情请参见云原生监控插件。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
监控CoreDNS运行状态 - 云容器引擎 CCE

redns metrics数据。若您是自建Prometheus监控Kubernetes集群，可以在Prometheus观测相关指标并对以下重点指标设置告警，具体操作请参见enables Prometheus metrics。父主题：服务端

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络 > CoreDNS配置优化实践 > 服务端
基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

基于GPU监控指标的工作负载弹性伸缩配置集群中包含GPU节点时，可通过GPU指标查看节点GPU资源的使用情况，例如GPU利用率、显存使用量等。在获取GPU监控指标后，用户可根据应用的GPU指标配置弹性伸缩策略，在业务波动时自适应调整应用的副本数量。前提条件目标集群已创建，且

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
PVC视图 - 云容器引擎 CCE
PVC视图 - 云容器引擎 CCE

提供了集群中的PVC监控视图，包含PV/PVC的状态、使用率情况。支持以下PVC类型监控：云硬盘类型的PVC（要求volumeMode参数值为Filesystem）支持使用量监控。本地持久卷类型的PVC（要求集群中安装的Everest版本大于等于2.4.41）支持使用量监控。极速文

 帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 监控中心 > 仪表盘
GPU视图 - 云容器引擎 CCE
GPU视图 - 云容器引擎 CCE

GPU视图 GPU资源指标可以衡量GPU性能和使用情况，包括GPU的利用率、温度、显存等方面的监控数据，帮助您掌控GPU运行状况。指标说明图1 GPU资源指标表1 GPU图表说明图表名称单位说明集群-显存使用率百分比集群的显存使用率计算公式：集群内容器显存使用总量/集群内显存总量

 帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 监控中心 > 仪表盘
Prometheus Server视图 - 云容器引擎 CCE

Server视图 Prometheus本地数据存储模式可以收集有关主机和应用程序的指标数据并存储在集群中，监控数据可以选择上报并存储到AOM或三方监控平台。Prometheus Server视图展示了Prometheus提供的一些内置指标，可用于监控和度量系统的性能和状态。指标说明 Prometheus

帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 监控中心 > 仪表盘
云原生监控插件版本发布记录 - 云容器引擎 CCE

云原生监控插件版本发布记录表1 云原生监控插件版本记录插件版本支持的集群版本更新特性社区版本 3.11.0 v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 适配CCE v1.30集群 2.37.8 3.10.1 v1.21 v1.23

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
使用PrometheusRules配置普罗监控与告警规则 - 云容器引擎 CCE

使用PrometheusRules配置普罗监控与告警规则 Prometheus具有PrometheusRule的能力，PrometheusRules提供了一种用于监控和警报的规则语言，能够方便用户更好的使用Prometheus查询监控指标，配置基于PromQL的告警规则。当前云原生监控插件仅支持开启本地

 帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 可观测性最佳实践
监控CCE Turbo集群容器网络扩展指标 - 云容器引擎 CCE

在“插件中心”页面右侧找到云原生监控插件，单击“安装”。在监控CCE Turbo集群容器网络扩展指标的场景下，建议您关注以下配置。该插件的其他配置可按需进行设置，详情请参见云原生监控插件。本地数据存储：此处选择使用本地存储监控数据，监控数据可选择是否对接AOM或三方监控平台。自定义指标采

 帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 可观测性最佳实践
通过AOM配置自定义告警 - 云容器引擎 CCE

规则类型：选择“事件告警规则”。事件类型：选择“系统事件”。事件来源：选择“CCE”。监控对象：监控对象可以通过多个维度（通知类型、事件名称、告警级别、自定义属性、命名空间、集群名称）进行筛选，您可以根据需要选择。本示例中根据“事件名称”进行筛选，选择“节点状态异常”事件，触发方式选择“立即触发”。

帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 告警中心
使用仪表盘 - 云容器引擎 CCE
使用仪表盘 - 云容器引擎 CCE

集群处于“运行中”状态。集群已开通“监控中心”。查看/切换视图登录CCE控制台，单击集群名称进入集群详情页。在左侧导航栏中选择“监控中心”，单击“仪表盘”页签，默认展示集群视图。监控中心仪表盘提供了预置视图，您可单击视图名称边上的“切换视图”按钮，选择需要的视图查看监控数据。设置查看视图的相关参数。

帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 监控中心 > 仪表盘
监控NGINX Ingress控制器指标 - 云容器引擎 CCE

Targets”，可以查看到Prometheus监控了哪些目标。图2 查看监控目标监控NGINX Ingress控制器指标访问Prometheus，在“Graph”页面中，查看NGINX Ingress控制器指标。图3 查看NGINX Ingress控制器监控指标表1 NGINX

帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 可观测性最佳实践
云原生监控插件升级检查异常处理 - 云容器引擎 CCE

云原生监控插件升级检查异常处理检查项内容在集群升级过程中，云原生监控插件从3.9.0之前的版本升级至3.9.0之后的版本升级时，存在兼容性问题，需检查该插件是否开启了grafana的开关。解决方案由于云原生监控插件在3.9.0之后的版本，不再聚合grafana的能力，因此

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
为什么CCE集群界面的节点磁盘监控看起来不准确？ - 云容器引擎 CCE

为什么CCE集群界面的节点磁盘监控看起来不准确？问题描述： CCE集群界面的某个节点磁盘监控高达80%以上，而进入云监控界面看到的磁盘使用率在40%不到。后面在该节点上排查，发现有一个pvc磁盘使用达到了92%，将这个盘清理后，集群界面的磁盘使用率和云监控使用率一致了。请问集群界面的节点监控是怎么

 帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群运行
工作负载的“事件”保存多长时间？ - 云容器引擎 CCE

2-r3及以上版本的集群中，工作负载的“事件”信息保存时间为1个小时，1小时后自动清除数据。在1.7.3-r12之前更老的集群版本中，保存时间为24小时。父主题：监控日志

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 监控日志

总条数： 940

上一页
1
2
3
4
5
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

监控运维配置 - 云容器引擎 CCE

监控GPU资源指标 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

基于ELB监控指标的弹性伸缩实践 - 云容器引擎 CCE

通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

监控CoreDNS运行状态 - 云容器引擎 CCE

基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

PVC视图 - 云容器引擎 CCE

GPU视图 - 云容器引擎 CCE

Prometheus Server视图 - 云容器引擎 CCE

云原生监控插件版本发布记录 - 云容器引擎 CCE

使用PrometheusRules配置普罗监控与告警规则 - 云容器引擎 CCE

监控CCE Turbo集群容器网络扩展指标 - 云容器引擎 CCE

通过AOM配置自定义告警 - 云容器引擎 CCE

使用仪表盘 - 云容器引擎 CCE

监控NGINX Ingress控制器指标 - 云容器引擎 CCE

云原生监控插件升级检查异常处理 - 云容器引擎 CCE

为什么CCE集群界面的节点磁盘监控看起来不准确？ - 云容器引擎 CCE

工作负载的“事件”保存多长时间？ - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线