搜索_华为云

使用AOM监控自定义指标 - 云容器引擎 CCE

使用AOM监控自定义指标 CCE支持上传自定义指标到AOM，节点上的ICAgent会定期调用负载中配置的监控指标接口读取监控数据，然后上传到AOM上。图1 ICAgent采集监控指标负载的自定义指标接口可以在创建时配置。本文将通过一个Nginx应用的示例演示如何上报自定义监控指标到AOM，步骤如下：

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
监控中心 - 云容器引擎 CCE
监控中心 - 云容器引擎 CCE

监控中心监控中心概述开通监控中心管理监控采集任务集群监控节点监控工作负载监控 Pod监控事件监控仪表盘父主题：云原生观测

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测
工作负载监控 - 云容器引擎 CCE

工作负载监控如果您需要监控工作负载的资源使用情况，可以前往“监控中心 > 工作负载”页面查看。该页面提供了指定集群下所有工作负载的综合信息，以及单个工作负载的详细监控数据，包括CPU/内存使用率、网络流入/流出速率等。功能入口登录CCE控制台，单击集群名称进入集群详情页。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
云原生监控 - 云容器引擎 CCE
云原生监控 - 云容器引擎 CCE

enablethird 否 Boolean 指标是否上报第三方监控系统 url_third 否 String 三方监控系统上报指标URL basic_auth_username_third 否 String 对接三方监控系统的账号（BasicAuth认证方式） basic_auth_password_third

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
监控中心FAQ - 云容器引擎 CCE
监控中心FAQ - 云容器引擎 CCE

监控中心FAQ 索引为什么监控中心没有数据了？如何关闭监控中心？监控中心为什么没有展示自定义指标？为什么云原生监控插件开启本地数据存储时，重启prometheus-server实例可能会导致节点列表的资源信息短时间（1-2分钟）无法正常显示？为什么云原生监控插件开启本地

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测FAQ
使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

仅适用于监控Kubernetes社区原生的GPU资源（nvidia.com/gpu），不支持监控CCE提供的GPU虚拟化资源。前提条件目标集群已创建，且集群中包含GPU节点，并已运行GPU相关业务。在集群中安装CCE AI 套件 (NVIDIA GPU)和云原生监控插件。 CCE

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
准备应用运行环境 - 云容器引擎 CCE

准备应用运行环境在应用分析后，您已经了解到应用所需的操作系统、运行环境等。您需要准备好这些环境。安装Docker：应用容器化时，需要将应用构建为容器镜像。您需要准备一台机器，并安装Docker。获取运行环境：获取运行应用的运行环境，以及对接的MongoDB数据库。安装Docker

帮助中心 > 云容器引擎 CCE > 最佳实践 > 容器化改造 > 企业管理应用容器化改造（ERP） > 实施步骤
节点ARP表项超过限制 - 云容器引擎 CCE

ARP缓存超限，容器网络的访问出现异常，例如coredns域名解析概率失败。问题根因出现该问题的原因是节点上容器缓存的ARP表项超过限制。问题定位在节点操作系统内核为4.3以上时，dmsg日志中会有显性的打印neighbor table overflow字样。详情请参见社区链接：link。 # dmesg

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 操作系统问题说明
cgroup统计资源异常导致kubelet驱逐Pod - 云容器引擎 CCE

7-r0、1.23.5-r0、1.25.1-r0及以上，请将节点重置为最新版本的操作系统即可修复该问题。若您的集群版本不满足要求，请将集群升级到上述指定的版本后，再将节点重置为最新版本的操作系统。父主题：操作系统问题说明

 帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 操作系统问题说明
监控运维配置 - 云容器引擎 CCE

监控运维配置 CCE为您提供监控应用及资源的能力，支持采集各项指标及事件等数据以分析应用健康状态，您可以通过“配置中心 > 监控运维配置”统一调整监控运维参数。您需要开通监控中心，以使用监控运维配置的所有功能。监控配置采集配置系统预置采集：可视化管理云原生监控插件的监控采集任务。详情请参见管理监控采集任务。

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心
修复Docker操作系统命令注入漏洞公告（CVE-2019-5736） - 云容器引擎 CCE

修复Docker操作系统命令注入漏洞公告（CVE-2019-5736）漏洞详情 Docker、containerd或者其他基于runc的容器运行时存在安全漏洞，攻击者可以通过特定的容器镜像或者exec操作可以获取到宿主机的runc执行时的文件句柄并修改掉runc的二进制文件，从而获取到宿主机的root执行权限。

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
云原生监控插件 - 云容器引擎 CCE

云原生监控插件插件简介云原生监控插件（原名kube-prometheus-stack）通过使用Prometheus-operator和Prometheus，提供简单易用的端到端Kubernetes集群监控能力。使用云原生监控插件可将监控数据与监控中心对接，在监控中心控制台查看监控数据，配置告警等。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
EulerOS 2.9内核缺陷导致虚拟机卡住 - 云容器引擎 CCE

检查修改是否成功，执行以下命令： sysctl -a | grep kernel.printk 确认kernel.printk参数为“1 4 1 7”。父主题：操作系统问题说明

 帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 操作系统问题说明
监控安全风险 - 云容器引擎 CCE

控策略。资源监控指标资源基础监控包含CPU/内存/磁盘等指标数据，您可以全面监控集群的健康状态和负荷程度，具体请参见监控概述。您可以在CCE控制台从集群、节点、工作负载等维度查看这些监控指标数据，也可以在AOM中查看。自定义指标 CCE支持采集应用程序中的自定义指标并上传到

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 安全
Linux Polkit 权限提升漏洞预警（CVE-2021-4034） - 云容器引擎 CCE

易受攻击主机的完全root权限，目前漏洞POC/EXP已公开，风险较高。 Polkit（PolicyKit）是一个用于在类Unix操作系统中控制系统范围权限的组件。pkexec是Plokit框架中的一部分，执行具有提升权限的命令，是sudo的替代方案。请使用Polkit的用户及时安排自检并做好安全加固。

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
GPU监控指标说明 - 云容器引擎 CCE

GPU监控指标说明 CCE AI套件（NVIDIA GPU）插件提供GPU监控指标，并集成了DCGM-Exporter组件（要求插件版本2.7.32+），引入更丰富的GPU可观测性场景。本文介绍CCE AI套件（NVIDIA GPU）插件指标的详细信息。计费说明 GPU指标作为

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
监控GPU资源指标 - 云容器引擎 CCE

Targets”，可以查看到Prometheus监控了哪些目标。图2 查看监控目标监控GPU指标创建一个使用GPU的工作负载，等工作负载正常运行后，访问Prometheus，在“Graph”页面中，查看GPU指标。关于GPU指标详情请参见GPU监控指标说明。图3 查看GPU监控指标访问Grafana

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
CCE集群IPVS转发模式下conn_reuse_mode问题说明 - 云容器引擎 CCE

不同操作系统情况如下：当节点的OS版本为EulerOS 2.5和CentOS 7.6时，内核版本低于4.1，因此kube-proxy会保持系统原有的默认值net.ipv4.vs.conn_reuse_mode=1，将存在•问题2，即高并发场景存在1秒延时。当节点的OS版本为Ubuntu

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 操作系统问题说明
容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致问题现象容器监控的内存使用率与实际弹性伸缩现象不一致，例如容器内存使用率在界面上显示为40%左右，而HPA设置缩容阈值为70%，但界面上显示的内存使用率低于HPA阈值后并没有发生缩容。问题根因界面上显示的容器内存使用率与HPA弹

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 监控日志
IPVS缺陷导致节点上升级CoreDNS后出现概率性解析超时 - 云容器引擎 CCE

04或Huawei Cloud EulerOS 2.0操作系统的节点上不存在此问题，CentOS/Ubuntu18.04/EulerOS 2.5/EulerOS 2.9（低版本内核）/Huawei Cloud EulerOS 1.1操作系统则存在此问题。解决方法考虑采用NodeLocal

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 操作系统问题说明

总条数： 907

上一页
1
2
3
4
5
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AOM监控自定义指标 - 云容器引擎 CCE

监控中心 - 云容器引擎 CCE

工作负载监控 - 云容器引擎 CCE

云原生监控 - 云容器引擎 CCE

监控中心FAQ - 云容器引擎 CCE

使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

准备应用运行环境 - 云容器引擎 CCE

节点ARP表项超过限制 - 云容器引擎 CCE

cgroup统计资源异常导致kubelet驱逐Pod - 云容器引擎 CCE

监控运维配置 - 云容器引擎 CCE

修复Docker操作系统命令注入漏洞公告（CVE-2019-5736） - 云容器引擎 CCE

云原生监控插件 - 云容器引擎 CCE

EulerOS 2.9内核缺陷导致虚拟机卡住 - 云容器引擎 CCE

监控安全风险 - 云容器引擎 CCE

Linux Polkit 权限提升漏洞预警（CVE-2021-4034） - 云容器引擎 CCE

GPU监控指标说明 - 云容器引擎 CCE

监控GPU资源指标 - 云容器引擎 CCE

CCE集群IPVS转发模式下conn_reuse_mode问题说明 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

IPVS缺陷导致节点上升级CoreDNS后出现概率性解析超时 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线