搜索_华为云

插件概述 - 云容器引擎 CCE
插件概述 - 云容器引擎 CCE

云原生可观测性插件插件名称插件简介云原生监控插件云原生监控插件包含Prometheus-operator和Prometheus组件，提供简单易用的端到端Kubernetes集群监控能力。使用云原生监控插件可将监控数据与监控中心对接，在监控中心控制台查看监控数据，配置告警等。云原生日志采集插件

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件
计费相关FAQ - 云容器引擎 CCE
计费相关FAQ - 云容器引擎 CCE

计费相关FAQ 索引可观测性（监控中心、日志中心、告警中心）如何收费？为什么关闭日志中心后还有收费产生？可观测性（监控中心、日志中心、告警中心）如何收费？免费场景监控中心自身免费使用，监控中心所使用的指标都上报并存储在AOM服务，其中在AOM范畴内的基础指标不收费，存储

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测FAQ
设置性能管理配置 - 云容器引擎 CCE

应用性能管理服务（APM）当前支持给JAVA类工作负载提供调用链、拓扑等监控能力。您可为JAVA类工作负载安装APM探针，以提供更精准的问题分析与定位，协助您高效解决应用难题。工作负载创建时和创建后，均可以对JAVA类工作负载监控进行设置。如果您已经使用CCE部署了容器应用，您需要应用性

 帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 配置工作负载
通过CCE配置自定义告警 - 云容器引擎 CCE

集群中各种资源是否存在异常。添加指标类告警示例基于Prometheus指标的阈值告警规则，指标告警规则依赖开通监控中心，请前往监控中心一键开通。详情请参见开通监控中心。部分指标模板依赖CCE节点故障检测插件（NPD）进行上报，指标详情请参见表1。如需要使用相关的告警规则，请

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
健康中心概述 - 云容器引擎 CCE

健康诊断覆盖范围如下图所示：图1 健康诊断覆盖范围健康诊断能力项支持开箱即用，可以在不开通监控中心情况下，进行基础的集群健康诊断支持全量检查集群整体运行状况（开通监控中心后），发现集群故障与潜在风险针对诊断结果，智能给出健康评分支持定时巡检，并可视化巡检结果支持查看巡检历史，方便用户分析故障原因

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 健康中心
GPU故障处理 - 云容器引擎 CCE
GPU故障处理 - 云容器引擎 CCE

unhealthy. NVML获取设备UUID异常隔离故障GPU节点的GPU设备 GPUXidError Xid=%d on Device=%s, UUID=%s, SN=%s, the device will go unhealthy. GPU设备存在Xid错误，Xid捕获范围为74和79

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
Prometheus（停止维护） - 云容器引擎 CCE

Prometheus（停止维护）插件简介 Prometheus是一套开源的系统监控报警框架。它启发于Google的borgmon监控系统，由工作在SoundCloud的Google前员工在2012年创建，作为社区开源项目进行开发，并于2015年正式发布。2016年，Prometheus正式加入Cloud

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
NVIDIA GPU驱动漏洞公告（CVE-2021-1056） - 云容器引擎 CCE

GPU驱动的一个漏洞CVE-2021-1056，该漏洞是存在于NVIDIA GPU驱动程序中与设备隔离相关的安全漏洞。当容器以非特权模式启动，攻击者利用这个漏洞，通过在容器中创建特殊的字符设备文件后，能够获取宿主机上所有GPU设备的访问权限。关于漏洞的详细信息，请参见CVE-2021-1056。如

 帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

部署dcgm-exporter组件。启用dcgm-exporter组件后，采集的GPU监控数据如需上报AOM服务，请安装云原生监控插件并开启上报至AOM服务开关，同时前往“配置中心 > 监控运维配置”页开启dcgm-exporter组件的ServiceMonitor。对于上报至

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生异构计算插件
CCE节点故障检测 - 云容器引擎 CCE

CCE节点故障检测插件简介 CCE节点故障检测插件（原名NPD）是一款监控集群节点异常事件的插件，以及对接第三方监控平台功能的组件。它是一个在每个节点上运行的守护程序，可从不同的守护进程中搜集节点问题并将其报告给apiserver。NPD可以作为DaemonSet运行，也可以独立运行。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
Kubernetes Dashboard - 云容器引擎 CCE

Kubernetes Dashboard 插件简介 Kubernetes Dashboard是一个旨在为Kubernetes世界带来通用监控和操作Web界面的项目，集合了命令行可以操作的所有命令。使用Kubernetes Dashboard，您可以：向Kubernetes集群部署容器化应用

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 其他插件
CCE节点故障检测 - 云容器引擎 CCE

CCE节点故障检测插件介绍 CCE节点故障检测插件（node-problem-detector，简称NPD）是一款监控集群节点异常事件的插件，以及对接第三方监控平台功能的组件。它是一个在每个节点上运行的守护程序，可从不同的守护进程中搜集节点问题并将其报告给apiserver。n

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
Grafana - 云容器引擎 CCE
Grafana - 云容器引擎 CCE

Grafana 插件简介 Grafana是一款开源的数据可视化和监控平台，可以为您提供丰富的图表和面板，用于实时监控、分析和可视化各种指标和数据源。安装插件登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”，在右侧找到Grafana，单击“安装”。设置插件

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
Linux CUPS服务RCE 漏洞公告（CVE-2024-47076、CVE-2024-47175、CVE-2024-47176、CVE-2024-47177） - 云容器引擎 CCE

CVE-2024-47177 严重 2024-09-26 漏洞影响该漏洞主要影响运行 CUPS 打印系统的 Unix 设备，若同时启用了 cups-browsed 服务，可能面临被远程攻击的风险，从而危及用户设备的安全。判断方法您可以在节点上执行以下命令查看是否安装CUPS相关服务： systemctl

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
管理工作负载 - 云容器引擎 CCE

用。监控您可以通过CCE控制台查看工作负载和容器组的CPU和内存占用情况，以确定需要的资源规格。本文以无状态工作负载为例说明如何使用监控功能。登录CCE控制台，进入一个已有的集群，在左侧导航栏中选择“工作负载”。选择“无状态负载”页签，单击已创建工作负载后的“监控”。在监

 帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载
集群诊断 - 云容器引擎 CCE
集群诊断 - 云容器引擎 CCE

功能入口登录CCE控制台，单击集群名称进入集群详情页。在左侧导航栏中选择“健康中心”。您可以在不开通监控中心的情况下，进行基础的集群健康诊断。如果想体验更丰富的诊断能力，请参考开通监控中心开通。配置定时巡检规则在“健康诊断”页面右上角打开“定时巡检”开关，并配置定时巡检启动的时

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 健康中心
Kubernetes Dashboard - 云容器引擎 CCE

Kubernetes Dashboard 插件介绍 Kubernetes Dashboard是一个旨在为Kubernetes世界带来通用监控和操作Web界面的项目，集合了命令行可以操作的所有命令。字段说明表1 参数描述参数是否必选参数类型描述 basic 否 object

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

cluster_version 否 String CCE集群版本 device_version 是 String 插件的版本 driver_version 是 String 插件安装驱动时，插件里负责安装驱动的Pod的镜像tag，一般与device_version相同 obs_url 是 String

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
准备GPU虚拟化资源 - 云容器引擎 CCE

准备GPU虚拟化资源 CCE GPU虚拟化采用自研xGPU虚拟化技术，能够动态对GPU设备显存与算力进行划分，单个GPU卡最多虚拟化成20个GPU虚拟设备。本文介绍如何在GPU节点上实现GPU的调度和隔离能力。前提条件配置支持版本集群版本 v1.23.8-r0、v1.25

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
GPU虚拟化概述 - 云容器引擎 CCE

GPU虚拟化概述 CCE GPU虚拟化采用自研xGPU虚拟化技术，能够动态对GPU设备显存与算力进行划分，单个GPU卡最多虚拟化成20个GPU虚拟设备。相对于静态分配来说，虚拟化的方案更加灵活，最大程度保证业务稳定的前提下，可以完全由用户自己定义使用的GPU量，提高GPU利用率。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化

总条数： 294

上一页
1
2
3
4
5
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

插件概述 - 云容器引擎 CCE

计费相关FAQ - 云容器引擎 CCE

设置性能管理配置 - 云容器引擎 CCE

通过CCE配置自定义告警 - 云容器引擎 CCE

健康中心概述 - 云容器引擎 CCE

GPU故障处理 - 云容器引擎 CCE

Prometheus（停止维护） - 云容器引擎 CCE

NVIDIA GPU驱动漏洞公告（CVE-2021-1056） - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

CCE节点故障检测 - 云容器引擎 CCE

Kubernetes Dashboard - 云容器引擎 CCE

CCE节点故障检测 - 云容器引擎 CCE

Grafana - 云容器引擎 CCE

Linux CUPS服务RCE 漏洞公告（CVE-2024-47076、CVE-2024-47175、CVE-2024-47176、CVE-2024-47177） - 云容器引擎 CCE

管理工作负载 - 云容器引擎 CCE

集群诊断 - 云容器引擎 CCE

Kubernetes Dashboard - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

准备GPU虚拟化资源 - 云容器引擎 CCE

GPU虚拟化概述 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线