搜索_华为云

监控GPU资源指标 - 云容器引擎 CCE

监控GPU资源指标通过Prometheus和Grafana，可以实现对GPU资源指标的观测。本文以实际示例介绍如何通过Prometheus查看集群的GPU显存的使用。本文将通过一个示例应用演示如何监控GPU资源指标，具体步骤如下：访问Prometheus （可选）为Prom

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
调整CoreDNS部署状态 - 云容器引擎 CCE

调整CoreDNS部署状态 CCE集群默认安装CoreDNS插件，CoreDNS应用默认情况下与您的业务容器运行在同样的集群节点上，部署时的注意事项如下：合理调整CoreDNS副本数合理分配CoreDNS所在位置使用自定义参数完成CoreDNS隔离部署基于HPA自动扩容CoreDNS

帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络 > CoreDNS配置优化实践 > 服务端
Service - 云容器引擎 CCE
Service - 云容器引擎 CCE

Service 直接访问Pod的问题 Pod创建完成后，如何访问Pod呢？直接访问Pod会有如下几个问题： Pod会随时被Deployment这样的控制器删除重建，那访问Pod的结果就会变得不可预知。 Pod的IP地址是在Pod启动后才被分配，在启动前并不知道Pod的IP地址。

帮助中心 > 云容器引擎 CCE > Kubernetes基础知识 > Kubernetes网络
通过静态存储卷使用已有云硬盘 - 云容器引擎 CCE

本文示例中无需选择。云硬盘b 单击“选择云硬盘”，您可以在新页面中勾选满足要求的云硬盘，并单击“确定”。 PV名称b 输入PV名称，同一集群内的PV名称需唯一。访问模式b 云硬盘类型的存储卷仅支持ReadWriteOnce，表示存储卷可以被一个节点以读写方式挂载，详情请参见存储卷访问模式。

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 云硬盘存储（EVS）
开通监控中心 - 云容器引擎 CCE

开通监控中心开通监控中心将在集群中安装云原生监控插件，该插件提供监控中心的指标采集功能。开通后，监控中心将采集集群中的指标并上报至AOM实例。本章节介绍如何为集群开通监控中心功能。开通监控中心后，集群中的指标将上报至AOM实例，AOM针对基础指标免费，自定义指标由AOM服务收费，具体请参考价格详情。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

使用dcgm-exporter监控GPU指标应用场景集群中包含GPU节点时，需要了解GPU应用使用节点GPU资源的情况，例如GPU利用率、显存使用量、GPU运行的温度、GPU的功率等。在获取GPU监控指标后，用户可根据应用的GPU指标配置弹性伸缩策略，或者根据GPU指标设置告

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
使用云原生监控插件监控自定义指标 - 云容器引擎 CCE

使用云原生监控插件监控自定义指标 CCE提供了云原生监控插件，支持使用Prometheus监控自定义指标。本文将通过一个Nginx应用的示例演示如何使用Prometheus监控自定义指标，步骤如下：安装并访问云原生监控插件 CCE提供了集成Prometheus功能的插件，支持一键安装。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
监控CCE Turbo集群容器网络扩展指标 - 云容器引擎 CCE

监控CCE Turbo集群容器网络扩展指标 CCE容器网络扩展指标插件是一款容器网络流量监控管理插件，可支持CCE Turbo集群非主机网络容器的流量统计，以及节点内容器连通性健康检查。监控信息已适配Prometheus格式，可以通过调用Prometheus接口查看监控数据。本

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
云容器引擎（CCE）与云容器实例（CCI）的区别是什么？ - 云容器引擎 CCE

云容器引擎（CCE）与云容器实例（CCI）的区别是什么？基本介绍表1 CCE和CCI基本介绍云容器引擎CCE 云容器实例CCI 云容器引擎（Cloud Container Engine，简称CCE）提供高度可扩展的、高性能的企业级Kubernetes集群，支持运行Docke

帮助中心 > 云容器引擎 CCE > 常见问题 > 相关服务
为ELB Ingress配置HTTPS证书 - 云容器引擎 CCE

为ELB Ingress配置HTTPS证书 Ingress支持配置SSL/TLS证书，以HTTPS协议的方式对外提供安全服务。当前支持在集群中使用以下方式配置Ingress证书：使用TLS类型的密钥证书：需要将证书导入至Secret中，CCE会将该证书自动配置到ELB侧（证书

 帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 路由（Ingress） > ELB Ingress管理 > ELB Ingress高级配置示例
使用密钥 - 云容器引擎 CCE
使用密钥 - 云容器引擎 CCE

使用密钥密钥创建后，可在工作负载环境变量和数据卷两个场景使用。请勿对以下CCE系统使用的密钥做任何操作，详情请参见集群系统密钥说明。请不要操作kube-system下的secrets。请不要操作任何命名空间下的default-secret、paas.elb。其中，defa

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置项与密钥
管理节点污点 - 云容器引擎 CCE

管理节点污点污点（Taint）能够使节点排斥某些特定的Pod，从而避免Pod调度到该节点上。通过控制台管理节点污点在CCE控制台上同样可以管理节点的污点，且可以批量操作。登录CCE控制台，单击集群名称进入集群。在集群控制台左侧导航栏中选择“节点管理”，切换至“节点”页签

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 管理节点
节点伸缩原理 - 云容器引擎 CCE

节点伸缩原理 HPA是针对Pod级别的，可以根据负载指标动态调整副本数量，但是如果集群的资源不足，新的副本无法运行的情况下，就只能对集群进行扩容。 CCE集群弹性引擎是Kubernetes提供的集群节点弹性伸缩组件，根据Pod调度状态及资源使用情况对集群的节点进行自动扩容缩容，同

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 节点弹性伸缩
Gitlab对接SWR和CCE执行CI/CD - 云容器引擎 CCE

Gitlab对接SWR和CCE执行CI/CD 应用现状 GitLab是利用Ruby on Rails一个开源的版本管理系统，实现一个自托管的Git项目仓库，可通过Web界面进行访问公开的或者私人项目。与Github类似，GitLab能够浏览源代码，管理缺陷和注释。可以管理团队对仓

 帮助中心 > 云容器引擎 CCE > 最佳实践 > DevOps
使用第三方镜像 - 云容器引擎 CCE

使用第三方镜像操作场景 CCE支持拉取第三方镜像仓库的镜像来创建工作负载。通常第三方镜像仓库必须经过认证（账号密码）才能访问，而CCE中容器拉取镜像是使用密钥认证方式，这就要求在拉取镜像前先创建镜像仓库的密钥。前提条件使用第三方镜像时，请确保工作负载运行的节点可访问公网。

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 配置工作负载
增强型CPU管理策略 - 云容器引擎 CCE

增强型CPU管理策略在Kubernetes默认提供的CPU管理策略中有none和static两种： none：默认不开启CPU管理策略，表示现有的调度行为。 static：开启静态绑核的CPU管理策略，允许为节点上具有某些资源特征的 Pod（Guaranteed pod）赋予增强的

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > CPU调度
监控NGINX Ingress控制器指标 - 云容器引擎 CCE

监控NGINX Ingress控制器指标通过Prometheus和Grafana，可以实现对NGINX Ingress控制器指标的观测。本文以实际示例介绍如何通过Prometheus查看集群的NGINX Ingress控制器指标，具体步骤如下：访问Prometheus （可

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
使用Spark on CCE - 云容器引擎 CCE

使用Spark on CCE 使用Spark的Kubernetes调度程序spark-submit，可以将Spark应用程序提交到Kubernetes集群中运行，详情请参见在Kubernetes上运行Spark。使用spark-submit提交Spark应用程序的工作原理如下：

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Spark
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

Kubeflow部署 Kubeflow的诞生背景基于Kubernetes构建一个端到端的AI计算平台是非常复杂和繁琐的过程，它需要处理很多个环节。如图1所示，除了熟知的模型训练环节之外还包括数据收集、预处理、资源管理、特性提取、数据验证、模型的管理、模型发布、监控等环节。对于一

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
集群过载保护最佳实践 - 云容器引擎 CCE

集群过载保护最佳实践随着业务不断扩展，Kubernetes集群规模不断增大，导致集群控制平面负载压力增大。当集群规模超过Kubernetes控制平面的承载能力时，可能会出现集群因过载而无法提供服务的情况。本文帮助您了解集群过载的现象、影响范围和影响因素，并详细介绍CCE集群的过

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 集群

总条数： 203

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

监控GPU资源指标 - 云容器引擎 CCE

调整CoreDNS部署状态 - 云容器引擎 CCE

Service - 云容器引擎 CCE

通过静态存储卷使用已有云硬盘 - 云容器引擎 CCE

开通监控中心 - 云容器引擎 CCE

使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

使用云原生监控插件监控自定义指标 - 云容器引擎 CCE

监控CCE Turbo集群容器网络扩展指标 - 云容器引擎 CCE

云容器引擎（CCE）与云容器实例（CCI）的区别是什么？ - 云容器引擎 CCE

为ELB Ingress配置HTTPS证书 - 云容器引擎 CCE

使用密钥 - 云容器引擎 CCE

管理节点污点 - 云容器引擎 CCE

节点伸缩原理 - 云容器引擎 CCE

Gitlab对接SWR和CCE执行CI/CD - 云容器引擎 CCE

使用第三方镜像 - 云容器引擎 CCE

增强型CPU管理策略 - 云容器引擎 CCE

监控NGINX Ingress控制器指标 - 云容器引擎 CCE

使用Spark on CCE - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

集群过载保护最佳实践 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线