搜索_华为云

CCE最佳实践汇总 - 云容器引擎 CCE

y的安全配置建议监控相关使用Prometheus监控多个集群使用dcgm-exporter监控GPU指标将Prometheus监控数据上报至第三方监控平台通过PromQL语句查询Prometheus数据使用云原生监控插件监控自定义指标使用AOM监控自定义指标使用P

帮助中心 > 云容器引擎 CCE > 最佳实践
可观测性最佳实践 - 云容器引擎 CCE

可观测性最佳实践云原生监控插件兼容自建Prometheus 使用云原生监控插件监控自定义指标使用AOM监控自定义指标使用PrometheusRules配置普罗监控与告警规则使用Prometheus监控Master节点组件指标监控NGINX Ingress控制器指标监控CCE Turbo集群容器网络扩展指标

 帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性
监控安全风险 - 云容器引擎 CCE

控策略。资源监控指标资源基础监控包含CPU/内存/磁盘等指标数据，您可以全面监控集群的健康状态和负荷程度，具体请参见监控概述。您可以在CCE控制台从集群、节点、工作负载等维度查看这些监控指标数据，也可以在AOM中查看。自定义指标 CCE支持采集应用程序中的自定义指标并上传到

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 安全
工作负载最佳实践 - 云容器引擎 CCE

在CCE集群中使用工作负载Identity的安全配置建议工作负载指标监控实践使用Prometheus监控多个集群使用dcgm-exporter监控GPU指标将Prometheus监控数据上报至第三方监控平台通过PromQL语句查询Prometheus数据工作负载弹性伸缩实践 CCE容器实例弹性伸缩到CCI服务

 帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载
诊断项及修复方案 - 云容器引擎 CCE

集群运维监控的能力，资源使用率过高会导致存在过载风险，影响集群监控能力。可前往“监控中心 > 工作负载”监控中查看prometheus实例相关指标情况，如果长时间达到瓶颈，可调整prometheus实例规格。说明： PVC资源使用率的检查在kube-prometheus-sta

帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 健康中心
创建使用自定义指标的HPA策略 - 云容器引擎 CCE

导航栏的“插件中心”。在“插件中心”页面右侧找到云原生监控插件，单击“安装”。建议您关注以下配置，其他配置可按需进行设置。详情请参见云原生监控插件。数据存储配置：必选本地数据存储，可选监控数据是否对接AOM或三方监控平台。自定义指标采集：该配置在本实践中必须选择开启，否则将无法采集自定义指标。

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 工作负载弹性伸缩
容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致问题现象容器监控的内存使用率与实际弹性伸缩现象不一致，例如容器内存使用率在界面上显示为40%左右，而HPA设置缩容阈值为70%，但界面上显示的内存使用率低于HPA阈值后并没有发生缩容。问题根因界面上显示的容器内存使用率与HPA弹

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 监控日志
弹性伸缩 - 云容器引擎 CCE
弹性伸缩 - 云容器引擎 CCE

项目来扩展Kubernetes的能力。 Prometheus是一套开源的系统监控报警框架，能够采集丰富的Metrics（度量数据），目前已经基本是Kubernetes的标准监控方案。 Metrics Server是Kubernetes集群范围资源使用数据的聚合器。Metrics

帮助中心 > 云容器引擎 CCE > Kubernetes基础知识
插件概述 - 云容器引擎 CCE
插件概述 - 云容器引擎 CCE

插件简介云原生监控插件 kube-prometheus-stack通过使用Prometheus-operator和Prometheus，提供简单易用的端到端Kubernetes集群监控能力。使用kube-prometheus-stack可将监控数据与监控中心对接，在监控中心控制台查看监控数据，配置告警等。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件
通过AOM配置自定义告警 - 云容器引擎 CCE

添加告警规则。事件类告警：根据集群上报到AOM的事件配置告警。推荐配置的事件和配置方法请参见添加事件类告警。指标类告警：实时监控环境中主机、组件等资源使用情况，根据监控指标阈值告警。推荐配置阈值指标和配置方法请参见添加指标类告警。在SMN创建主题 SMN（Simple Message

帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 告警中心
工作负载伸缩原理 - 云容器引擎 CCE

存使用率等等。而这些数据的监控能力Kubernetes也没有自己实现，而是通过其他项目来扩展Kubernetes的能力，Kubernetes提供Prometheus和Metrics Server插件来实现该能力： Prometheus是一套开源的系统监控报警框架，能够采集丰富的M

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 工作负载弹性伸缩
云原生监控插件版本发布记录 - 云容器引擎 CCE

云原生监控插件版本发布记录表1 云原生监控插件版本记录插件版本支持的集群版本更新特性社区版本 3.11.0 v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 适配CCE v1.30集群 2.37.8 3.10.1 v1.21 v1.23

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
PVC视图 - 云容器引擎 CCE
PVC视图 - 云容器引擎 CCE

提供了集群中的PVC监控视图，包含PV/PVC的状态、使用率情况。支持以下PVC类型监控：云硬盘类型的PVC（要求volumeMode参数值为Filesystem）支持使用量监控。本地持久卷类型的PVC（要求集群中安装的Everest版本大于等于2.4.41）支持使用量监控。极速文

 帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 监控中心 > 仪表盘
云原生可观测性插件 - 云容器引擎 CCE

云原生可观测性插件云原生监控插件云原生日志采集插件 CCE节点故障检测 CCE容器网络扩展指标 Kubernetes Metrics Server Grafana Prometheus（停止维护）父主题：插件

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件
弹性伸缩 - 云容器引擎 CCE
弹性伸缩 - 云容器引擎 CCE

弹性伸缩使用HPA+CA实现工作负载和节点联动弹性伸缩 CCE容器实例弹性伸缩到CCI服务基于Prometheus指标的弹性伸缩实践基于ELB监控指标的弹性伸缩实践通过Nginx Ingress对多个应用进行弹性伸缩

 帮助中心 > 云容器引擎 CCE > 最佳实践
GPU视图 - 云容器引擎 CCE
GPU视图 - 云容器引擎 CCE

GPU视图 GPU资源指标可以衡量GPU性能和使用情况，包括GPU的利用率、温度、显存等方面的监控数据，帮助您掌控GPU运行状况。指标说明图1 GPU资源指标表1 GPU图表说明图表名称单位说明集群-显存使用率百分比集群的显存使用率计算公式：集群内容器显存使用总量/集群内显存总量

 帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 监控中心 > 仪表盘
CCE节点故障检测 - 云容器引擎 CCE

置告警。如果您需要使用NPD检查项配置告警规则，集群中需要安装“云原生监控插件”，且该插件已对接AOM实例。 Prometheus指标采集 NPD 守护进程POD通过端口19901暴露Prometheus metrics指标，NPD Pod默认被注释metrics.alpha.kubernetes

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
云原生监控插件升级检查异常处理 - 云容器引擎 CCE

云原生监控插件升级检查异常处理检查项内容在集群升级过程中，云原生监控插件从3.9.0之前的版本升级至3.9.0之后的版本升级时，存在兼容性问题，需检查该插件是否开启了grafana的开关。解决方案由于云原生监控插件在3.9.0之后的版本，不再聚合grafana的能力，因此

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
创建HPA策略 - 云容器引擎 CCE
创建HPA策略 - 云容器引擎 CCE

15及以上版本的集群中支持）说明：使用自定义策略时，集群中需要安装支持采集自定义指标的插件（例如Prometheus），且工作负载需正常上报并采集自定义指标。采集自定义指标的方法及示例请参见使用云原生监控插件监控自定义指标。自定义指标名称：自定义指标的名称，输入时可根据联想值进行选择。指标

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 工作负载弹性伸缩
重调度（Descheduler） - 云容器引擎 CCE

metrics：监控数据采集方式，当前支持通过Custom Metrics API（prometheus_adaptor聚合数据）和Prometheus 直接查询。 Volcano 1.11.17及之后的版本推荐使用Custom Metrics API的方式获取监控数据，示例如下：

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > 资源利用率优化调度

总条数： 535

上一页
1
2
3
4
5
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CCE最佳实践汇总 - 云容器引擎 CCE

可观测性最佳实践 - 云容器引擎 CCE

监控安全风险 - 云容器引擎 CCE

工作负载最佳实践 - 云容器引擎 CCE

诊断项及修复方案 - 云容器引擎 CCE

创建使用自定义指标的HPA策略 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

弹性伸缩 - 云容器引擎 CCE

插件概述 - 云容器引擎 CCE

通过AOM配置自定义告警 - 云容器引擎 CCE

工作负载伸缩原理 - 云容器引擎 CCE

云原生监控插件版本发布记录 - 云容器引擎 CCE

PVC视图 - 云容器引擎 CCE

云原生可观测性插件 - 云容器引擎 CCE

弹性伸缩 - 云容器引擎 CCE

GPU视图 - 云容器引擎 CCE

CCE节点故障检测 - 云容器引擎 CCE

云原生监控插件升级检查异常处理 - 云容器引擎 CCE

创建HPA策略 - 云容器引擎 CCE

重调度（Descheduler） - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线