搜索_华为云

监控GPU资源指标 - 云容器引擎 CCE

监控GPU资源指标通过Prometheus和Grafana，可以实现对GPU资源指标的观测。本文以实际示例介绍如何通过Prometheus查看集群的GPU显存的使用。本文将通过一个示例应用演示如何监控GPU资源指标，具体步骤如下：访问Prometheus （可选）为Prom

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
使用kubectl对接已有云硬盘 - 云容器引擎 CCE

13及以下版本的集群。操作步骤登录EVS控制台，创建一个EVS云硬盘，记录云硬盘的VolumeID、容量和磁盘类型。请参见通过kubectl连接集群，使用kubectl连接集群。新建两个yaml文件，用于创建PersistentVolume（PV）、PersistentVolumeClaim（

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储管理-Flexvolume（已弃用） > 云硬盘存储卷
使用Volcano调度工作负载 - 云容器引擎 CCE

使用Volcano调度工作负载 Volcano是一个基于Kubernetes的批处理平台，提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力，通过接入AI、大数据、基因、渲染等诸多行业计算框架服务终端用户，并针对计算型应用提供了作业调度、作业管理、队列管理等多项功能。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
为负载均衡类型的Service配置黑名单/白名单访问策略 - 云容器引擎 CCE

为负载均衡类型的Service配置黑名单/白名单访问策略使用负载均衡类型的服务时，您可以通过添加白名单和黑名单的方式控制访问负载均衡监听器的IP。白名单：指定的IP允许访问，而其它IP不能访问。黑名单：指定的IP不能访问，而其它IP允许访问。配置黑名单/白名单访问策略后，

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 服务（Service） > 负载均衡（LoadBalancer）
节点ID文件检查异常处理 - 云容器引擎 CCE

节点ID文件检查异常处理检查项内容检查节点的ID文件内容是否符合格式。解决方案在CCE控制台上的“节点管理”页面，单击异常节点名称进入ECS界面。复制节点ID，保存到本地。图1 复制节点ID 登录异常节点，备份文件。 cp /var/lib/cloud/data/instance-id

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
什么是云原生网络2.0网络模式，适用于什么场景？ - 云容器引擎 CCE

能几乎一致，所以适用于对带宽、时延要求极高的业务场景，比如：线上直播、电商优惠等。大规模组网：云原生网络2.0当前最大可支持2000个ECS节点，10万个容器。父主题：网络规划

 帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理 > 网络规划
开通成本洞察 - 云容器引擎 CCE

DMS UserAccess AOM 支持用户通过 DMS 获取数据订阅的功能，因此需要获得该权限。 AOM ECS CommonOperations AOM 支持通过在 ECS 上安装 UniAgent 和 ICAgent 获取系统指标、日志数据，因此需要获得该权限。 AOM CES

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生成本治理 > 成本洞察
使用Prometheus监控Master节点组件指标 - 云容器引擎 CCE

heus Operator。由于Prometheus（停止维护）插件版本已停止演进，不再支持该功能特性，请避免使用。使用kubectl连接集群。修改Prometheus的ClusterRole。 kubectl edit ClusterRole prometheus -n {namespace}

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
如何解决yum update升级操作系统导致的容器网络不可用问题？ - 云容器引擎 CCE

done fi depmod ${sys_version} } upgrade_kmod 执行完成后，重启虚拟机。相关链接集群节点高危操作父主题：节点运行

 帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
单集群视角的成本洞察 - 云容器引擎 CCE

选中时间内成本分布。当前资源涵盖范围有：ECS成本、EVS成本、CCE集群管理成本成本趋势每天的成本分布趋势。从中可以看出，集群内成本开销趋势，可识别花费较高的资源图3 集群各维度成本分析名称含义命名空间命名空间总成本：按命名空间聚合工作负载的成本，包括 CPU 成本（ECS）、内存成本（ECS）、EVS

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生成本治理 > 成本洞察
云原生监控插件 - 云容器引擎 CCE

nos-query、custom-metrics-apiserver、alertmanager、kube-state-metrics组件按多实例方式部署。采集分片数（选择非“本地数据存储”时支持设置）：当Prometheus的数据量很大时，您可以通过设置该参数，将数据分片到指定

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
伸缩节点池 - 云容器引擎 CCE
伸缩节点池 - 云容器引擎 CCE

ScaleNodePoolRequestBody(); List<String> listSpecScaleGroups = new ArrayList<>(); listSpecScaleGroups.add("default"); ScaleNodePoolSpec

帮助中心 > 云容器引擎 CCE > API参考 > API > 节点池管理
责任共担 - 云容器引擎 CCE
责任共担 - 云容器引擎 CCE

华为云租户的安全责任在于对使用的 IaaS、PaaS 和 SaaS 类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API 网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 安全
操作系统镜像版本说明 - 云容器引擎 CCE

eulerosv2r9.x86 64 2024年9月更新系统内核，修复CVE-2024-1086安全漏洞。修复内核缺陷导致低概率出现虚拟机卡住的问题。 4.18.0-147.5.1.6.h1152.eulerosv2r9.x86_64 2024年4月更新系统内核，修复安全漏洞。

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 操作系统镜像发布记录
成本洞察概述 - 云容器引擎 CCE

源使用状况，进而识别可优化的应用。成本洞察关键能力丰富的容器成本覆盖范围：支持成本分析的费用包括CCE集群管理费用、CCE集群关联的ECS和EVS资源费用。基于计费账单的精准成本计算：使用真实账单进行成本分摊计算，精准统计集群成本。灵活的成本分摊策略：支持集群、命名空间、

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生成本治理 > 成本洞察
兼容性风险检查异常处理 - 云容器引擎 CCE

兼容性风险检查异常处理检查项内容请您阅读版本兼容性差异，并确认不受影响。补丁升级不涉及版本兼容性差异。版本兼容性差异版本升级路径版本差异建议自检措施 v1.23/v1.25 升级至v1.27 容器运行时Docker不再被推荐使用，建议您使用Containerd进行替换，详情请参见容器引擎说明。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
Tensorflow训练 - 云容器引擎 CCE
Tensorflow训练 - 云容器引擎 CCE

metadata: name: tfjob-simple namespace: kubeflow spec: tfReplicaSpecs: Worker: replicas: 2 restartPolicy: OnFailure template:

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
通过节点池升级节点的GPU驱动版本 - 云容器引擎 CCE

务运行。登录CCE控制台，单击集群名称进入集群控制台。单击“节点管理”，找到更新驱动的节点池，单击“节点列表”。单击节点名称跳转到ECS界面。单击右上角“重启”。步骤三：验证驱动升级是否成功节点完成重启后，请稍等几分钟，等待驱动安装。登录节点，查看节点上的驱动是否更新。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
更新AddonInstance - 云容器引擎 CCE

"*****", "driver_init_image_version" : "2.1.30", "ecsEndpoint" : "*****", "everest_image_version" : "2.1.30",

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件管理
冻结或不可用的集群删除后如何清除残留资源 - 云容器引擎 CCE

冻结或不可用的集群删除后如何清除残留资源处于非运行状态（例如冻结、不可用状态）中的集群，由于无法获取集群中的PVC、Service、Ingress等资源，因此删除集群之后可能会残留网络及存储等资源，您需要前往资源所属服务手动删除。弹性负载均衡资源前往弹性负载均衡控制台。通过集群使用的VPC

帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群删除

总条数： 669

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

监控GPU资源指标 - 云容器引擎 CCE

使用kubectl对接已有云硬盘 - 云容器引擎 CCE

使用Volcano调度工作负载 - 云容器引擎 CCE

为负载均衡类型的Service配置黑名单/白名单访问策略 - 云容器引擎 CCE

节点ID文件检查异常处理 - 云容器引擎 CCE

什么是云原生网络2.0网络模式，适用于什么场景？ - 云容器引擎 CCE

开通成本洞察 - 云容器引擎 CCE

使用Prometheus监控Master节点组件指标 - 云容器引擎 CCE

如何解决yum update升级操作系统导致的容器网络不可用问题？ - 云容器引擎 CCE

单集群视角的成本洞察 - 云容器引擎 CCE

云原生监控插件 - 云容器引擎 CCE

伸缩节点池 - 云容器引擎 CCE

责任共担 - 云容器引擎 CCE

操作系统镜像版本说明 - 云容器引擎 CCE

成本洞察概述 - 云容器引擎 CCE

兼容性风险检查异常处理 - 云容器引擎 CCE

Tensorflow训练 - 云容器引擎 CCE

通过节点池升级节点的GPU驱动版本 - 云容器引擎 CCE

更新AddonInstance - 云容器引擎 CCE

冻结或不可用的集群删除后如何清除残留资源 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线