搜索_华为云

监控安全风险 - 云容器引擎 CCE

监控安全风险结合应用运维管理AOM服务，CCE提供基于Kubernetes原生类型的容器监控能力，可实时监控应用及资源，采集各项指标及事件等数据以分析应用健康状态，提供全面、清晰、多维度数据可视化能力。此外，您还可以根据自己的需求，采集和监控工作负载的自定义指标，实现个性化的监控策略。

帮助中心 > 云容器引擎 CCE > 产品介绍 > 安全
使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

[镜像名称1:版本名称1]：请替换为您本地所要上传的实际镜像的名称和版本名称。 [镜像仓库地址]：可在SWR控制台上查询，2中登录指令末尾的域名即为镜像仓库地址。 [组织名称]：请替换为1中创建的组织。 [镜像名称2:版本名称2]：请替换为SWR镜像仓库中需要显示的镜像名称和镜像版本。示例： docker

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
监控中心FAQ - 云容器引擎 CCE
监控中心FAQ - 云容器引擎 CCE

插件云原生监控插件是否为“运行中”。图1 检查插件运行状态如果插件运行异常，可以根据云原生监控插件的实例的事件进行排查。图2 查看插件事件可能原因二：云原生监控插件对接的AOM实例被删除请在集群详情的“插件中心”页面，检查插件云原生监控插件的配置。图3 编辑插件配置确认AOM实例非空。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测FAQ
使用云原生监控插件监控自定义指标 - 云容器引擎 CCE

使用云原生监控插件监控自定义指标 CCE提供了云原生监控插件，支持使用Prometheus监控自定义指标。本文将通过一个Nginx应用的示例演示如何使用Prometheus监控自定义指标，步骤如下：安装并访问云原生监控插件 CCE提供了集成Prometheus功能的插件，支持一键安装。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
云容器引擎（CCE）与云容器实例（CCI）的区别是什么？ - 云容器引擎 CCE

少运维成本。无缝对接华为云容器镜像服务SWR，支持使用公用镜像和私有镜像。支持CCI容器实例的事件同步、监控、日志、exec、查看状态等操作。支持查看虚拟弹性节点的节点容量信息。支持CCE和CCI两侧实例的service网络互通。详情请参见CCE容器实例弹性伸缩到CCI服务。

帮助中心 > 云容器引擎 CCE > 常见问题 > 相关服务
监控中心 - 云容器引擎 CCE
监控中心 - 云容器引擎 CCE

监控中心监控中心概述开通监控中心管理监控采集任务集群监控节点监控工作负载监控 Pod监控事件监控仪表盘父主题：云原生观测

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测
监控GPU资源指标 - 云容器引擎 CCE

ncer类型的Service，支持从外部访问Prometheus。监控GPU指标在集群中部署使用GPU能力的工作负载，将自动上报GPU监控指标。访问Grafana 从Grafana可视化面板中查看Prometheus的监控数据。前提条件集群中已安装云原生监控插件插件。集群中已安装CCE

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
云容器引擎（CCE）和应用管理与运维平台（ServiceStage）的区别是什么？ - 云容器引擎 CCE

云容器引擎（CCE）和应用管理与运维平台（ServiceStage）的区别是什么？对于使用者而言，云容器引擎关注的重点是Pod的部署，应用管理与运维平台关注的是服务的使用。对于技术实现来看，应用管理与运维平台是对云容器引擎的再一次封装。基础概念云容器引擎（CCE）云容器引擎（Cloud

帮助中心 > 云容器引擎 CCE > 常见问题 > 相关服务
PVC视图 - 云容器引擎 CCE
PVC视图 - 云容器引擎 CCE

提供了集群中的PVC监控视图，包含PV/PVC的状态、使用率情况。支持以下PVC类型监控：云硬盘类型的PVC（要求volumeMode参数值为Filesystem）支持使用量监控。本地持久卷类型的PVC（要求集群中安装的Everest版本大于等于2.4.41）支持使用量监控。极

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
GPU监控指标说明 - 云容器引擎 CCE

2（20%），可能有如下情况：在整个时间间隔内，有20%的SM的Tensor Core以100%的利用率运行。在整个时间间隔内，有100%的SM的Tensor Core以20%的利用率运行。在整个时间间隔的1/5时间内，有100%的SM上的Tensor Core以100%利用率运行。其他组合模式。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
工作负载的“事件”保存多长时间？ - 云容器引擎 CCE

工作负载的“事件”保存多长时间？在1.7.3-r12、1.9.2-r3及以上版本的集群中，工作负载的“事件”信息保存时间为1个小时，1小时后自动清除数据。在1.7.3-r12之前更老的集群版本中，保存时间为24小时。父主题：监控日志

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 监控日志
仪表盘 - 云容器引擎 CCE
仪表盘 - 云容器引擎 CCE

CoreDNS视图 PVC视图 Kubelet视图 Prometheus Server视图 Prometheus Agent视图父主题：监控中心

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
云原生监控插件升级检查异常处理 - 云容器引擎 CCE

手动创建的grafana的服务（service）和路由（ingress）无法直接绑定至新的grafana插件，需要手动修改服务的选择器的配置，请及时修改对应的选择器。方案一：如果当前插件能够升级至3.9.0及以上的版本，请前往“插件中心”页面，单击云原生监控插件的“升级”按钮

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

Language的缩写，是一种用于查询和聚合时间序列数据的查询语言。Prometheus是一个开源的监控系统，用于收集和存储时间序列数据，每个时间序列都由一个唯一的标识符和一组时间戳-值对组成。而PromQL是Prometheus的核心组件之一，使用标识符和标签组成的简单表达式对时

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
XGPU视图 - 云容器引擎 CCE
XGPU视图 - 云容器引擎 CCE

每张GPU卡上的GPU虚拟化设备的显存总量占这张GPU卡显存总量的比例计算公式：显卡上所有XGPU设备能使用的显存上限之和 / 显卡显存总量 GPU卡-XGPU设备算力使用率百分比每张GPU卡的GPU虚拟化设备的算力使用率计算公式：显卡上所有XGPU设备当前所使用的算力之和 /

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
Pod视图 - 云容器引擎 CCE
Pod视图 - 云容器引擎 CCE

从Pod视角呈现Pod维度集群资源、网络、磁盘等监控情况，帮助您详细了解Pod的运行状态。指标说明 Pod视图暴露的指标包括Pod资源指标、Pod网络指标和Pod磁盘指标，具体说明如下：图1 Pod资源指标表1 Pod资源指标说明指标名称单位说明容器数个 Pod中的容器总数运行中容器数个

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
主机视图 - 云容器引擎 CCE
主机视图 - 云容器引擎 CCE

主机视图从主机视角出发，监控主机的资源占用与健康状态，查看主机的磁盘、文件系统等常用系统设备指标，帮助您掌控节点运行状况。指标说明主机视图暴露的指标具体说明如下：图1 主机资源指标表1 视图说明图表名称单位说明 CPU使用率百分比每个CPU核的使用率平均负载 / 平均负载反映了CPU资源的竞争情况

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
CoreDNS视图 - 云容器引擎 CCE
CoreDNS视图 - 云容器引擎 CCE

基于TCP协议的请求数据包的P99、P90、P50的大小响应速率(响应状态码) 个/秒 CoreDNS不同状态码每秒的请求数响应时延毫秒 CoreDNS P99、P90、P50的请求时延响应数据包(UDP) 字节数基于UDP协议的响应数据包的P99、P90、P50的大小响应数据包(TCP)

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
Prometheus Agent视图 - 云容器引擎 CCE

Agent是轻量化的容器监控模式，可以收集有关主机和应用程序的指标数据，并将数据上报并存储到AOM或三方监控平台。Prometheus Agent视图展示了Prometheus提供的一些内置指标，可用于监控和度量系统的性能和状态。指标说明 Prometheus Agent视图暴露的指标如下：

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
Prometheus Server视图 - 云容器引擎 CCE

可用于并行发送到远程存储的分片数的最大值最小队列数个可用于并行发送到远程存储的分片数的最小值期望队列数个分片队列期望基于输入样本和输出样本的比率运行的分片数队列容量个用于并行发送到远程存储的队列每个分片的容量挂起中的样本数个用于并行发送到远程存储的队列中每个分片的容量 TSDB当前段

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘

总条数： 923

上一页
1
2
3
4
5
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

监控安全风险 - 云容器引擎 CCE

使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

监控中心FAQ - 云容器引擎 CCE

使用云原生监控插件监控自定义指标 - 云容器引擎 CCE

云容器引擎（CCE）与云容器实例（CCI）的区别是什么？ - 云容器引擎 CCE

监控中心 - 云容器引擎 CCE

监控GPU资源指标 - 云容器引擎 CCE

云容器引擎（CCE）和应用管理与运维平台（ServiceStage）的区别是什么？ - 云容器引擎 CCE

PVC视图 - 云容器引擎 CCE

GPU监控指标说明 - 云容器引擎 CCE

工作负载的“事件”保存多长时间？ - 云容器引擎 CCE

仪表盘 - 云容器引擎 CCE

云原生监控插件升级检查异常处理 - 云容器引擎 CCE

通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

XGPU视图 - 云容器引擎 CCE

Pod视图 - 云容器引擎 CCE

主机视图 - 云容器引擎 CCE

CoreDNS视图 - 云容器引擎 CCE

Prometheus Agent视图 - 云容器引擎 CCE

Prometheus Server视图 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线