搜索_华为云

安全运行时与普通运行时 - 云容器引擎 CCE

安全运行时与普通运行时相比于普通运行时，安全运行时可以让您的每个容器（准确地说是Pod）都运行在一个单独的微型虚拟机中，拥有独立的操作系统内核，以及虚拟化层的安全隔离。通过使用安全运行时，不同容器之间的内核、计算资源、网络都是隔离开的，保护了Pod的资源和数据不被其他Pod抢占和窃取。

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 配置工作负载
监控 - 云容器引擎 CCE
监控 - 云容器引擎 CCE

监控使用Prometheus监控多个集群使用dcgm-exporter监控GPU指标将Prometheus监控数据上报至第三方监控平台通过PromQL语句查询Prometheus数据

 帮助中心 > 云容器引擎 CCE > 最佳实践
工作负载监控 - 云容器引擎 CCE

内存使用率：负载的所有Pod的容器在不同的时间段使用的内存总量占负载的所有Pod的容器的内存Limit总量比例。网络相关指标网络总流出速率：负载的所有Pod的容器在不同的时间段的每秒钟发送的总字节数。网络总流入速率：负载的所有Pod的容器在不同的时间段的每秒钟接收的总字节数。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
开通监控中心 - 云容器引擎 CCE

开通监控中心开通监控中心将在集群中安装云原生监控插件，该插件提供监控中心的指标采集功能。开通后，监控中心将采集集群中的指标并上报至AOM实例。本章节介绍如何为集群开通监控中心功能。开通监控中心后，集群中的指标将上报至AOM实例，AOM针对基础指标免费，自定义指标由AOM服务收费，具体请参考价格详情。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
监控日志 - 云容器引擎 CCE
监控日志 - 云容器引擎 CCE

监控日志工作负载的“事件”保存多长时间？容器监控的内存使用率与实际弹性伸缩现象不一致父主题：工作负载

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载
节点监控 - 云容器引擎 CCE
节点监控 - 云容器引擎 CCE

磁盘读取速率：节点上的每个文件系统在不同的时间段的每秒钟读取的字节数。磁盘写入速率：节点上的每个文件系统在不同的时间段的每秒钟写入的字节数。磁盘使用率：节点上的每个文件系统在不同的时间段已使用的空间所占各自总空间的比例。 Pod相关指标 Pod CPU使用率：节点上每个Pod在不同的时间段的CPU使用量占它们的CPU

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
云原生监控 - 云容器引擎 CCE
云原生监控 - 云容器引擎 CCE

云原生监控插件介绍云原生监控插件（kube-prometheus-stack）通过使用Prometheus-operator和Prometheus，提供简单易用的端到端Kubernetes集群监控能力。使用kube-prometheus-stack可将监控数据与监控中心对接

 帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
监控中心概述 - 云容器引擎 CCE

测性的最常见工具，其强大的监控能力和活跃的社区生态，使其成功CNCF最活跃的托管项目之一。当前CCE插件市场提供了云原生监控插件用于Kubernetes集群的监控。华为云AOM云服务基于Prometheus监控生态，提供了托管式的Prometheus实例 for CCE，适合需

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
监控运维配置 - 云容器引擎 CCE

监控运维配置 CCE为您提供监控应用及资源的能力，支持采集各项指标及事件等数据以分析应用健康状态，您可以通过“配置中心 > 监控运维配置”统一调整监控运维参数。您需要开通监控中心，以使用监控运维配置的所有功能。监控配置采集配置系统预置采集：可视化管理云原生监控插件的监控采集任务。详情请参见管理监控采集任务。

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心
云原生监控插件 - 云容器引擎 CCE

3.9.0后的版本回滚至3.9.0前的版本，请先卸载Grafana插件再进行回滚操作。权限说明云原生监控插件中的node-exporter组件会监控Docker的存储磁盘空间，需要读取宿主机的/var/run/docker.sock的获取Docker的info的数据。 node-exporter运行需要以下特权：

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
使用AOM监控自定义指标 - 云容器引擎 CCE

使用AOM监控自定义指标 CCE支持上传自定义指标到AOM，节点上的ICAgent会定期调用负载中配置的监控指标接口读取监控数据，然后上传到AOM上。图1 ICAgent采集监控指标负载的自定义指标接口可以在创建时配置。本文将通过一个Nginx应用的示例演示如何上报自定义监控指标到AOM，步骤如下：

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致问题现象容器监控的内存使用率与实际弹性伸缩现象不一致，例如容器内存使用率在界面上显示为40%左右，而HPA设置缩容阈值为70%，但界面上显示的内存使用率低于HPA阈值后并没有发生缩容。问题根因界面上显示的容器内存使用率与HPA弹

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 监控日志
集群监控 - 云容器引擎 CCE
集群监控 - 云容器引擎 CCE

除了控制面组件和Master节点的异常占比，控制面资源概况中还提供了API Server的总QPS和请求错误率指标。作为集群的API服务提供者，控制面API Server的异常可能会导致整个集群无法访问，同时也会影响依赖API Server的工作负载的正常运行，QPS和请求错误率可以帮助您快速识别和修复问题。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
事件监控 - 云容器引擎 CCE
事件监控 - 云容器引擎 CCE

“概览”页面默认展示集群中所有命名空间的事件统计信息，您也可以在右上角的下拉框中切换命名空间，以查看指定命名空间下的事件数据。根据图1的事件统计数据，您可以清晰地了解到Normal和Warning事件的数量分布情况，呈现为一个圆环图；Warning事件资源维度TOP5指的是排名前五的Warning事

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
Pod监控 - 云容器引擎 CCE
Pod监控 - 云容器引擎 CCE

们的内存Limit量的比例。容器CPU受限：Pod的每个容器在不同的时间段的CPU受限时间所占的比例。容器网络丢包率：Pod的每个的容器在不同的时间段接收丢失的数据包总量占接收的数据包总量的比例。其他指标 Pod 历史状态：Pod在不同时间段所处的状态。容器历史状态：Pod的每个容器在不同的时间段所处的状态。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
管理监控采集任务 - 云容器引擎 CCE

管理监控采集任务您可以简单、方便地可视化管理采集任务，所有的配置均可在升级云原生监控插件时得到保留。前提条件集群中已安装云原生监控插件3.11.0及以上版本。管理监控采集任务开启默认关闭的采集任务、添加基础免费指标之外的指标后，若您已对接AOM，AOM服务会按量收取费用。具体请参考价格详情。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
将Prometheus监控数据上报至第三方监控平台 - 云容器引擎 CCE

步骤三：对接第三方监控平台登录CCE控制台，选择一个已安装云原生监控插件的集群，单击集群名称。在左侧导航栏中选择“配置中心”，并切换至“监控运维配置”页签。开启“对接第三方监控平台”，将云原生监控插件采集到的数据上报至第三方监控平台。数据上报地址：即步骤一中获取的Remote Write

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
Prometheus（停止维护） - 云容器引擎 CCE

CCE提供的Prometheus插件仅支持1.21及以下版本的集群。1.23及以上集群请使用云原生监控插件插件替代。插件特点作为新一代的监控框架，Prometheus具有以下特点：强大的多维度数据模型：时间序列数据通过metric名和键值对来区分。所有的metrics都可以设置任意的多维标签。数据模型更随意，不需要刻意设置为以点分隔的字符串。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
使用Prometheus监控多个集群 - 云容器引擎 CCE

获取目标集群bearer_token信息。 1.21以前版本的集群中，Pod中获取Token的形式是通过挂载ServiceAccount的Secret来获取Token，这种方式获得的Token是永久的。该方式在1.21及以上的版本中不再推荐使用，并且根据社区版本迭代策略，在1.25及以上版本的集群中，ServiceA

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

netes提供的资源管理、应用编排、运维监控能力。 Kubernetes存在的问题 Kubeflow在调度环境使用的是Kubernetes的默认调度器。而Kubernetes默认调度器最初主要是为长期运行的服务设计的，对于AI、大数据等批量和弹性调度方面还有很多的不足。主要存在以下问题：

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow

总条数： 925

上一页
1
2
3
4
5
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

安全运行时与普通运行时 - 云容器引擎 CCE

监控 - 云容器引擎 CCE

工作负载监控 - 云容器引擎 CCE

开通监控中心 - 云容器引擎 CCE

监控日志 - 云容器引擎 CCE

节点监控 - 云容器引擎 CCE

云原生监控 - 云容器引擎 CCE

监控中心概述 - 云容器引擎 CCE

监控运维配置 - 云容器引擎 CCE

云原生监控插件 - 云容器引擎 CCE

使用AOM监控自定义指标 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

集群监控 - 云容器引擎 CCE

事件监控 - 云容器引擎 CCE

Pod监控 - 云容器引擎 CCE

管理监控采集任务 - 云容器引擎 CCE

将Prometheus监控数据上报至第三方监控平台 - 云容器引擎 CCE

Prometheus（停止维护） - 云容器引擎 CCE

使用Prometheus监控多个集群 - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线