搜索_华为云

使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

控数据如需上报AOM服务，请在云原生监控插件中开启上报至AOM服务开关。对于上报至AOM服务的GPU指标属于自定义指标，将进行按需收费，详情请参见价格详情。设置插件支持的其他参数配置，单击“安装”。参数配置详情请参见CCE AI套件（NVIDIA GPU）。监控应用GPU指标

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
Grafana - 云容器引擎 CCE
Grafana - 云容器引擎 CCE

数据源对接AOM 将普罗数据上报至 AOM 服务。开启后，可选择对应的AOM实例。采集的基础指标免费，自定义指标将由AOM服务进行收费，详情请参见价格详情。对接AOM需要用户具备一定权限，目前仅华为云/华为账号，或者在admin用户组下的用户支持此操作。公网访问 1.2.1及以

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
存储类（StorageClass） - 云容器引擎 CCE

V2，当IOPS大于3000时会收取额外IOPS费用，详情请参见价格计算器。极速型SSD v2类型的IOPS范围为100~256000，最高可配置 1000*容量（GiB）。选择极速型SSD V2，使用IOPS会收取额外IOPS费用，详情请参见价格计算器。 everest.io/disk-throughput

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储
创建使用自定义指标的HPA策略 - 云容器引擎 CCE

创建使用自定义指标的HPA策略 Kubernetes默认的HPA策略只支持基于CPU和内存的自动伸缩，在复杂的业务场景中，仅使用CPU和内存使用率指标进行弹性伸缩往往无法满足日常运维需求。通过自定义指标配置工作负载HPA策略，可以根据业务自身特点，通过更多指标实现更灵活的弹性配置。

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 工作负载弹性伸缩
用于配置ELB Ingress的注解（Annotations） - 云容器引擎 CCE

弹性规格：适用于业务用量波动较大的场景，按实际使用量收取每小时使用的容量费用。v1.21.10-r10、v1.23.8-r10、v1.25.3-r10及以上版本集群支持使用弹性规格。固定规格：适用于业务用量较为稳定的场景，按固定规格折算收取每小时使用的容量费用。独享型负载均衡器独有字段。 l7_flavor_name

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 路由（Ingress） > ELB Ingress管理
集群可用但节点状态为“不可用”如何解决？ - 云容器引擎 CCE

集群可用但节点状态为“不可用”如何解决？当集群状态为“可用”，而集群中部分节点状态为“不可用”时，请参照本文提供的排查思路解决。节点不可用检测机制说明 Kubernetes 节点发送的心跳确定每个节点的可用性，并在检测到故障时采取行动。检测的机制和间隔时间详细说明请参见心跳。

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
工作负载异常：实例驱逐异常（Evicted） - 云容器引擎 CCE

工作负载异常：实例驱逐异常（Evicted）驱逐原理当节点出现异常时，为了保证工作负载的可用性，Kubernetes会通过驱逐机制（Eviction）将该节点上的Pod调离异常节点。目前Kubernetes中存在两种Eviction机制，分别由kube-controller-manager和kubelet实现。

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
自定义StorageClass - 云容器引擎 CCE

V2，当IOPS大于3000时会收取额外IOPS费用，详情请参见价格计算器。极速型SSD v2类型的IOPS范围为100~256000，最高可配置 1000*容量（GiB）。选择极速型SSD V2，使用IOPS会收取额外IOPS费用，详情请参见价格计算器。 everest.io/disk-throughput

帮助中心 > 云容器引擎 CCE > 最佳实践 > 存储
CCE集群内域名解析失败，如何定位处理？ - 云容器引擎 CCE

CCE集群内域名解析失败，如何定位处理？排查项一：检查是否已安装CoreDNS插件登录CCE控制台，进入集群。在左侧导航栏中选择“插件中心”，确认异常的集群是否已安装CoreDNS插件。如果未安装，请安装。详情请参见为什么CCE集群的容器无法通过DNS解析？排查项二：检查CoreDNS实例是否已到达性能瓶颈

 帮助中心 > 云容器引擎 CCE > 常见问题 > 域名DNS
CCE集群新增节点时的问题与排查方法？ - 云容器引擎 CCE

CCE集群新增节点时的问题与排查方法？注意事项同一集群下的节点镜像保证一致，后续新建/添加/纳管节点时需注意。新建节点时，数据盘如需分配用户空间，分配目录注意不要设置关键目录，例如：如需放到home下，建议设置为/home/test，不要直接写到/home/下。请注意“挂

 帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点创建
云原生网络2.0模型说明 - 云容器引擎 CCE

云原生网络2.0模型说明云原生网络2.0模型云原生网络2.0是自研的新一代容器网络模型，深度整合了虚拟私有云VPC的弹性网卡（Elastic Network Interface，简称ENI）和辅助弹性网卡（Sub Network Interface，简称Sub-ENI）的能力

 帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 容器网络 > 云原生网络2.0模型
功能总览 - 云容器引擎 CCE
功能总览 - 云容器引擎 CCE

功能总览功能总览全部集群管理节点管理节点池管理工作负载管理容器网络容器存储弹性伸缩应用调度容器运维模板市场插件管理权限管理集群管理 CCE是一种托管的Kubernetes产品/服务，可进一步简化基于容器的应用程序部署和管理，您可以在CCE中方便的创建

 帮助中心 > 云容器引擎 CCE > 功能总览
CCE控制台的权限依赖 - 云容器引擎 CCE

策略后，大概需要等待5分钟系统策略能生效。如果使用文件存储，需要设置SFS FullAccess权限。集群管理应用运维管理 AOM 费用中心 BSS 如果需要弹性扩容权限，需要设置AOM FullAccess权限。如果需要转包周期，需要设置BSS Administrator权限。

帮助中心 > 云容器引擎 CCE > 用户指南 > 权限
权限管理 - 云容器引擎 CCE
权限管理 - 云容器引擎 CCE

权限管理 CCE权限管理是在统一身份认证服务（IAM）与Kubernetes的角色访问控制（RBAC）的能力基础上，打造的细粒度权限管理功能，支持基于IAM的细粒度权限控制和IAM Token认证，支持集群级别、命名空间级别的权限控制，帮助用户便捷灵活的对租户下的IAM用户、用户组设定不同的操作权限。

帮助中心 > 云容器引擎 CCE > 产品介绍
不同场景下容器内获取客户端源IP - 云容器引擎 CCE

不同场景下容器内获取客户端源IP 在容器化环境中，客户端与容器服务器间的通信可能涉及多种代理服务器。当外部请求经过代理服务器多层转发时，客户端源IP地址可能无法被成功传递至容器内的业务中。本文将针对CCE集群提供网络访问的不同方案，详细说明如何在容器内部有效地获取客户端源IP。场景介绍

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络
使用Prometheus监控Master节点组件指标 - 云容器引擎 CCE

er、etcd-server组件进行监控，请参考以下步骤。此3个组件监控指标不在容器基础指标范围，监控中心将该类指标上报至AOM后会进行收费，因此监控中心会默认屏蔽采集该类指标。登录CCE控制台，单击集群名称进入集群详情页。在左侧导航栏中选择“配置与密钥”，并切换至“mon

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
基于Prometheus指标的弹性伸缩实践 - 云容器引擎 CCE

基于Prometheus指标的弹性伸缩实践 Kubernetes默认的HPA策略只支持基于CPU和内存的自动伸缩，在复杂的业务场景中，仅使用CPU和内存使用率指标进行弹性伸缩往往无法满足日常运维需求。为此，CCE提供云原生监控插件（kube-prometheus-stack），可

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 弹性伸缩
网络概述 - 云容器引擎 CCE
网络概述 - 云容器引擎 CCE

网络概述关于集群的网络，可以从如下两个角度进行了解：集群网络是什么样的：集群由多个节点构成，集群中又运行着Pod（容器），每个Pod都需要访问，节点与节点、节点与Pod、Pod与Pod都需要访问。那集群中包含有哪些网络，各自的用处是什么，具体请参见集群网络构成。集群中的Po

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络
工作负载异常：启动容器失败 - 云容器引擎 CCE

工作负载异常：启动容器失败问题定位工作负载详情中，若事件中提示“启动容器失败”，请按照如下方式来初步排查原因：登录异常工作负载所在的节点。查看工作负载实例非正常退出的容器ID。如果节点为docker，请执行docker命令： docker ps -a | grep $podName

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
在CCE集群中部署使用Tensorflow - 云容器引擎 CCE

在CCE集群中部署使用Tensorflow 资源准备购买CCE集群，购买GPU节点并使用gpu-beta插件安装显卡驱动。在集群下添加一个对象存储卷。数据预置从https://github.com/zalandoresearch/fashion-mnist下载数据。获取

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算

总条数： 463

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

Grafana - 云容器引擎 CCE

存储类（StorageClass） - 云容器引擎 CCE

创建使用自定义指标的HPA策略 - 云容器引擎 CCE

用于配置ELB Ingress的注解（Annotations） - 云容器引擎 CCE

集群可用但节点状态为“不可用”如何解决？ - 云容器引擎 CCE

工作负载异常：实例驱逐异常（Evicted） - 云容器引擎 CCE

自定义StorageClass - 云容器引擎 CCE

CCE集群内域名解析失败，如何定位处理？ - 云容器引擎 CCE

CCE集群新增节点时的问题与排查方法？ - 云容器引擎 CCE

云原生网络2.0模型说明 - 云容器引擎 CCE

功能总览 - 云容器引擎 CCE

CCE控制台的权限依赖 - 云容器引擎 CCE

权限管理 - 云容器引擎 CCE

不同场景下容器内获取客户端源IP - 云容器引擎 CCE

使用Prometheus监控Master节点组件指标 - 云容器引擎 CCE

基于Prometheus指标的弹性伸缩实践 - 云容器引擎 CCE

网络概述 - 云容器引擎 CCE

工作负载异常：启动容器失败 - 云容器引擎 CCE

在CCE集群中部署使用Tensorflow - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线