搜索_华为云

CCE集群中的节点无法远程登录，如何排查解决？ - 云容器引擎 CCE

CCE集群中的节点无法远程登录，如何排查解决？ CCE创建节点成功后，无法ssh远程登录。ssh回显提示“所选的用户密钥未在远程主机上注册”，即root用户不能直接登录到节点。出现上述问题的原因是CCE创建的节点安装了cloudinit，有默认的linux用户，并且该密钥也是用于linux。

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
管理监控采集任务 - 云容器引擎 CCE

管理监控采集任务您可以简单、方便地可视化管理采集任务，所有的配置均可在升级云原生监控插件时得到保留。前提条件集群中已安装云原生监控插件3.11.0及以上版本。管理监控采集任务开启默认关闭的采集任务、添加基础免费指标之外的指标后，若您已对接AOM，AOM服务会按量收取费用。具体请参考价格详情。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
开通监控中心 - 云容器引擎 CCE

开通监控中心开通监控中心将在集群中安装云原生监控插件，该插件提供监控中心的指标采集功能。开通后，监控中心将采集集群中的指标并上报至AOM实例。本章节介绍如何为集群开通监控中心功能。开通监控中心后，集群中的指标将上报至AOM实例，AOM针对基础指标免费，自定义指标由AOM服务收费，具体请参考价格详情。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
监控运维配置 - 云容器引擎 CCE

监控运维配置 CCE为您提供监控应用及资源的能力，支持采集各项指标及事件等数据以分析应用健康状态，您可以通过“配置中心 > 监控运维配置”统一调整监控运维参数。您需要开通监控中心，以使用监控运维配置的所有功能。监控配置采集配置系统预置采集：可视化管理云原生监控插件的监控采集任务。详情请参见管理监控采集任务。

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心
监控中心FAQ - 云容器引擎 CCE
监控中心FAQ - 云容器引擎 CCE

监控中心FAQ 索引为什么监控中心没有数据了？如何关闭监控中心？监控中心为什么没有展示自定义指标？为什么云原生监控插件开启本地数据存储时，重启prometheus-server实例可能会导致节点列表的资源信息短时间（1-2分钟）无法正常显示？为什么云原生监控插件开启本地

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测FAQ
将Prometheus监控数据上报至第三方监控平台 - 云容器引擎 CCE

env.yaml 步骤三：对接第三方监控平台登录CCE控制台，选择一个已安装云原生监控插件的集群，单击集群名称。在左侧导航栏中选择“配置中心”，并切换至“监控运维配置”页签。开启“对接第三方监控平台”，将云原生监控插件采集到的数据上报至第三方监控平台。数据上报地址：即步骤一中获取的Remote

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
使用Prometheus监控多个集群 - 云容器引擎 CCE

登录到Prometheus所在机器，进入Prometheus的安装目录，将目标集群的token信息保存在文件中。配置Prometheus监控job。示例job监控的是容器指标。如果需要监控其他指标，可自行添加job编写抓取规则。 - job_name: k8s_cAdvisor scheme: https

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
监控GPU资源指标 - 云容器引擎 CCE

Targets”，可以查看到Prometheus监控了哪些目标。图2 查看监控目标监控GPU指标创建一个使用GPU的工作负载，等工作负载正常运行后，访问Prometheus，在“Graph”页面中，查看GPU指标。关于GPU指标详情请参见GPU监控指标说明。图3 查看GPU监控指标访问Grafana

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
使用云原生监控插件监控自定义指标 - 云容器引擎 CCE

使用云原生监控插件监控自定义指标 CCE提供了云原生监控插件，支持使用Prometheus监控自定义指标。本文将通过一个Nginx应用的示例演示如何使用Prometheus监控自定义指标，步骤如下：安装并访问云原生监控插件 CCE提供了集成Prometheus功能的插件，支持一键安装。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
云原生监控插件 - 云容器引擎 CCE

云原生监控插件插件简介云原生监控插件（原名kube-prometheus-stack）通过使用Prometheus-operator和Prometheus，提供简单易用的端到端Kubernetes集群监控能力。使用云原生监控插件可将监控数据与监控中心对接，在监控中心控制台查看监控数据，配置告警等。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
使用AOM监控自定义指标 - 云容器引擎 CCE

使用AOM监控自定义指标 CCE支持上传自定义指标到AOM，节点上的ICAgent会定期调用负载中配置的监控指标接口读取监控数据，然后上传到AOM上。图1 ICAgent采集监控指标负载的自定义指标接口可以在创建时配置。本文将通过一个Nginx应用的示例演示如何上报自定义监控指标到AOM，步骤如下：

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

仅适用于监控Kubernetes社区原生的GPU资源（nvidia.com/gpu），不支持监控CCE提供的GPU虚拟化资源。前提条件目标集群已创建，且集群中包含GPU节点，并已运行GPU相关业务。在集群中安装CCE AI 套件 (NVIDIA GPU)和云原生监控插件。 CCE

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
使用Prometheus监控Master节点组件指标 - 云容器引擎 CCE

通过监控中心查看Master节点组件指标云原生监控中心已支持对Master节点的kube-apiserver组件进行监控，您在集群中开通云原生监控中心后（安装云原生监控插件版本为3.5.0及以上），可以查看仪表盘中的APIServer视图，监控API指标。如需对kube-controller、kube-sched

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
通过AOM配置自定义告警 - 云容器引擎 CCE

在SMN创建主题。创建行动规则。添加告警规则。事件类告警：根据集群上报到AOM的事件配置告警。推荐配置的事件和配置方法请参见添加事件类告警。指标类告警：实时监控环境中主机、组件等资源使用情况，根据监控指标阈值告警。推荐配置阈值指标和配置方法请参见添加指标类告警。在SMN创建主题

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
监控CCE Turbo集群容器网络扩展指标 - 云容器引擎 CCE

在“插件中心”页面右侧找到云原生监控插件，单击“安装”。在监控CCE Turbo集群容器网络扩展指标的场景下，建议您关注以下配置。该插件的其他配置可按需进行设置，详情请参见云原生监控插件。本地数据存储：此处选择使用本地存储监控数据，监控数据可选择是否对接AOM或三方监控平台。自定义指标采

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
GPU监控指标说明 - 云容器引擎 CCE

GPU监控指标说明 CCE AI套件（NVIDIA GPU）插件提供GPU监控指标，并集成了DCGM-Exporter组件（要求插件版本2.7.32+），引入更丰富的GPU可观测性场景。本文介绍CCE AI套件（NVIDIA GPU）插件指标的详细信息。计费说明 GPU指标作为

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
Prometheus Server视图 - 云容器引擎 CCE

存储在WAL中的样本的最高时间戳与远程写入成功的最高时间戳的比率远程写流量字节/秒远程写入的速率当前队列数个当前用于并行发送到远程存储的分片数最大队列数个可用于并行发送到远程存储的分片数的最大值最小队列数个可用于并行发送到远程存储的分片数的最小值期望队列数

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus 云原生监控插件兼容模式若您已自建Prometheus，且您的Prometheus基于开源，未做深度定制、未与您的监控系统深度整合，建议您卸载自建Prometheus并直接使用云原生监控插件对您的集群进行监控，无需开启“兼容模式”。卸

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

标准，越来越多的应用选择向Kubernetes迁移。人工智能和机器学习领域天然的包含大量的计算密集型任务，开发者非常愿意基于Kubernetes构建AI平台，充分利用Kubernetes提供的资源管理、应用编排、运维监控能力。 Kubernetes存在的问题 Kubeflow在

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

通过控制台获取华为云Prometheus监控数据在集群中安装云原生监控插件，采集Prometheus监控数据。登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”。在“插件中心”页面右侧找到云原生监控插件，单击“安装”。建议您关注以下配置，其他配置可按需进行设置。详情请参见云原生监控插件。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控

总条数： 254

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CCE集群中的节点无法远程登录，如何排查解决？ - 云容器引擎 CCE

管理监控采集任务 - 云容器引擎 CCE

开通监控中心 - 云容器引擎 CCE

监控运维配置 - 云容器引擎 CCE

监控中心FAQ - 云容器引擎 CCE

将Prometheus监控数据上报至第三方监控平台 - 云容器引擎 CCE

使用Prometheus监控多个集群 - 云容器引擎 CCE

监控GPU资源指标 - 云容器引擎 CCE

使用云原生监控插件监控自定义指标 - 云容器引擎 CCE

云原生监控插件 - 云容器引擎 CCE

使用AOM监控自定义指标 - 云容器引擎 CCE

使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

使用Prometheus监控Master节点组件指标 - 云容器引擎 CCE

通过AOM配置自定义告警 - 云容器引擎 CCE

监控CCE Turbo集群容器网络扩展指标 - 云容器引擎 CCE

GPU监控指标说明 - 云容器引擎 CCE

Prometheus Server视图 - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线