搜索_华为云

监控中心FAQ - 云容器引擎 CCE
监控中心FAQ - 云容器引擎 CCE

监控中心FAQ 索引为什么监控中心没有数据了？如何关闭监控中心？监控中心为什么没有展示自定义指标？为什么云原生监控插件开启本地数据存储时，重启prometheus-server实例可能会导致节点列表的资源信息短时间（1-2分钟）无法正常显示？为什么云原生监控插件开启本地

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测FAQ
云原生监控 - 云容器引擎 CCE
云原生监控 - 云容器引擎 CCE

云原生监控插件介绍云原生监控插件（kube-prometheus-stack）通过使用Prometheus-operator和Prometheus，提供简单易用的端到端Kubernetes集群监控能力。使用kube-prometheus-stack可将监控数据与监控中心对接

 帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
云原生监控插件 - 云容器引擎 CCE

云原生监控插件插件简介云原生监控插件（原名kube-prometheus-stack）通过使用Prometheus-operator和Prometheus，提供简单易用的端到端Kubernetes集群监控能力。使用云原生监控插件可将监控数据与监控中心对接，在监控中心控制台查看监控数据，配置告警等。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

仅适用于监控Kubernetes社区原生的GPU资源（nvidia.com/gpu），不支持监控CCE提供的GPU虚拟化资源。前提条件目标集群已创建，且集群中包含GPU节点，并已运行GPU相关业务。在集群中安装CCE AI 套件 (NVIDIA GPU)和云原生监控插件。 CCE

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
CCE集群安全配置建议 - 云容器引擎 CCE

CCE集群安全配置建议从安全的角度，建议您对集群做如下配置。使用最新版本的CCE集群 Kubernetes社区一般4个月左右发布一个大版本，CCE的版本发布频率跟随社区版本发布节奏，在社区发布Kubernetes版本后3个月左右同步发布新的CCE版本，例如Kubernetes

帮助中心 > 云容器引擎 CCE > 最佳实践 > 安全
使用AOM监控自定义指标 - 云容器引擎 CCE

使用AOM监控自定义指标 CCE支持上传自定义指标到AOM，节点上的ICAgent会定期调用负载中配置的监控指标接口读取监控数据，然后上传到AOM上。图1 ICAgent采集监控指标负载的自定义指标接口可以在创建时配置。本文将通过一个Nginx应用的示例演示如何上报自定义监控指标到AOM，步骤如下：

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
CCE节点安全配置建议 - 云容器引擎 CCE

-rf /root/.kube 加固VPC安全组规则 CCE作为通用的容器平台，安全组规则的设置适用于通用场景。用户可根据安全需求，通过网络控制台的安全组找到CCE集群对应的安全组规则进行安全加固。详情请参见如何加固CCE集群的自动创建的安全组规则？节点应按需进行加固 CCE服务

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 安全
监控运维配置 - 云容器引擎 CCE

监控运维配置 CCE为您提供监控应用及资源的能力，支持采集各项指标及事件等数据以分析应用健康状态，您可以通过“配置中心 > 监控运维配置”统一调整监控运维参数。您需要开通监控中心，以使用监控运维配置的所有功能。监控配置采集配置系统预置采集：可视化管理云原生监控插件的监控采集任务。详情请参见管理监控采集任务。

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心
安全配置概述 - 云容器引擎 CCE

安全配置概述基于安全责任共担模式，CCE服务确保集群内master节点和CCE自身组件的安全，并在集群、容器级别提供一系列的层次化的安全能力，而用户则负责集群Node节点的安全并遵循CCE服务提供的安全最佳实践，做好安全配置和运维。 CCE服务的应用场景云容器引擎是基于业界主

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 安全
安全运行时与普通运行时 - 云容器引擎 CCE

安全运行时与普通运行时相比于普通运行时，安全运行时可以让您的每个容器（准确地说是Pod）都运行在一个单独的微型虚拟机中，拥有独立的操作系统内核，以及虚拟化层的安全隔离。通过使用安全运行时，不同容器之间的内核、计算资源、网络都是隔离开的，保护了Pod的资源和数据不被其他Pod抢占和窃取。

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 配置工作负载
监控GPU资源指标 - 云容器引擎 CCE

Targets”，可以查看到Prometheus监控了哪些目标。图2 查看监控目标监控GPU指标创建一个使用GPU的工作负载，等工作负载正常运行后，访问Prometheus，在“Graph”页面中，查看GPU指标。关于GPU指标详情请参见GPU监控指标说明。图3 查看GPU监控指标访问Grafana

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
GPU监控指标说明 - 云容器引擎 CCE

GPU监控指标说明 CCE AI套件（NVIDIA GPU）插件提供GPU监控指标，并集成了DCGM-Exporter组件（要求插件版本2.7.32+），引入更丰富的GPU可观测性场景。本文介绍CCE AI套件（NVIDIA GPU）插件指标的详细信息。计费说明 GPU指标作为

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
容器安全插件 - 云容器引擎 CCE

容器安全插件 CCE密钥管理（对接 DEW）容器镜像签名验证父主题：插件

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件
在CCE集群中使用工作负载Identity的安全配置建议 - 云容器引擎 CCE

在CCE集群中使用工作负载Identity的安全配置建议工作负载Identity允许集群中的工作负载模拟IAM用户来访问云服务，从而无需直接使用IAM账号的AK/SK等信息，降低安全风险。本文档介绍如何在CCE中使用工作负载Identity。约束与限制支持1.19.16及以上版本集群。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 安全
容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致问题现象容器监控的内存使用率与实际弹性伸缩现象不一致，例如容器内存使用率在界面上显示为40%左右，而HPA设置缩容阈值为70%，但界面上显示的内存使用率低于HPA阈值后并没有发生缩容。问题根因界面上显示的容器内存使用率与HPA弹

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 监控日志
认证证书 - 云容器引擎 CCE
认证证书 - 云容器引擎 CCE

认证证书合规证书华为云服务及平台通过了多项国内外权威机构（ISO/SOC/PCI等）的安全合规认证，用户可自行申请下载合规资质证书。图1 合规证书下载资源中心华为云还提供以下资源来帮助用户满足合规性要求，具体请查看资源中心。图2 资源中心销售许可证&软件著作权证书

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 安全
通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

通过控制台获取华为云Prometheus监控数据在集群中安装云原生监控插件，采集Prometheus监控数据。登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”。在“插件中心”页面右侧找到云原生监控插件，单击“安装”。建议您关注以下配置，其他配置可按需进行设置。详情请参见云原生监控插件。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
PVC视图 - 云容器引擎 CCE
PVC视图 - 云容器引擎 CCE

提供了集群中的PVC监控视图，包含PV/PVC的状态、使用率情况。支持以下PVC类型监控：云硬盘类型的PVC（要求volumeMode参数值为Filesystem）支持使用量监控。本地持久卷类型的PVC（要求集群中安装的Everest版本大于等于2.4.41）支持使用量监控。极速文

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

标准，越来越多的应用选择向Kubernetes迁移。人工智能和机器学习领域天然的包含大量的计算密集型任务，开发者非常愿意基于Kubernetes构建AI平台，充分利用Kubernetes提供的资源管理、应用编排、运维监控能力。 Kubernetes存在的问题 Kubeflow在

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
更改集群节点的默认安全组 - 云容器引擎 CCE

更改集群节点的默认安全组操作场景集群在创建时可指定自定义节点安全组，方便统一管理节点的网络安全策略。对于已创建的集群，支持修改集群默认的节点安全组。约束与限制一个安全组关联的实例数量建议不超过1000个，否则可能引起安全组性能下降。更多关于安全组的限制请参考安全组限制。不支

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 管理集群

总条数： 493

上一页
1
2
3
4
5
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

监控中心FAQ - 云容器引擎 CCE

云原生监控 - 云容器引擎 CCE

云原生监控插件 - 云容器引擎 CCE

使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

CCE集群安全配置建议 - 云容器引擎 CCE

使用AOM监控自定义指标 - 云容器引擎 CCE

CCE节点安全配置建议 - 云容器引擎 CCE

监控运维配置 - 云容器引擎 CCE

安全配置概述 - 云容器引擎 CCE

安全运行时与普通运行时 - 云容器引擎 CCE

监控GPU资源指标 - 云容器引擎 CCE

GPU监控指标说明 - 云容器引擎 CCE

容器安全插件 - 云容器引擎 CCE

在CCE集群中使用工作负载Identity的安全配置建议 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

认证证书 - 云容器引擎 CCE

通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

PVC视图 - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

更改集群节点的默认安全组 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线