搜索_华为云

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

lib64" enable_fault_isolation 否 Bool 默认值：true true：插件识别GPU硬件故障或驱动程序问题，设置GPU卡不可用 enable_health_monitoring 否 Bool 默认值：true true：插件能够识别GPU硬件故障或驱动程序问题

 帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
资源与成本规划 - 云容器引擎 CCE

资源与成本规划本文提供的成本预估费用仅供参考，资源的实际费用与用户所在区域相关，请以华为云管理控制台显示为准。完成本实践所需的资源如下：表1 资源和成本规划资源资源说明数量费用（元）弹性云服务器ECS 建议选择按需计费。虚拟机类型：通用计算增强型节点规格：4核

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 容器化改造 > 企业管理应用容器化改造（ERP）
节点ARP表项超过限制 - 云容器引擎 CCE

default.gc_thresh3确定，此内核参数非namespace隔离，节点和节点上运行容器会共用ARP表项大小。容器场景下，该参数推荐设置为163790。此内核参数计算公式如下： CCE Turbo集群&容器隧道网络模型集群： net.ipv4.neigh.default.gc_thresh3

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 操作系统问题说明
CCE AI套件（NVIDIA GPU）版本发布记录 - 云容器引擎 CCE

21 v1.23 v1.25 节点池支持配置GPU驱动版本支持GPU指标采集 1.2.20 v1.19 v1.21 v1.23 v1.25 设置插件别名为gpu 1.2.17 v1.15 v1.17 v1.19 v1.21 v1.23 增加nvidia-driver-install

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
创建使用自定义指标的HPA策略 - 云容器引擎 CCE

登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”。在“插件中心”页面右侧找到云原生监控插件，单击“安装”。建议您关注以下配置，其他配置可按需进行设置。详情请参见云原生监控插件。数据存储配置：必选本地数据存储，可选监控数据是否对接AOM或三方监控平台。自定义指标采集：该配置在本实践中

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 工作负载弹性伸缩
为ELB Ingress配置自定义Header转发策略 - 云容器引擎 CCE

_） value的取值范围：长度限制1-128字符，不支持空格，双引号，支持以下通配符：*（匹配0个或更多字符）和?（正好匹配1个字符）设置自定义Header转发策略后，Ingress不能再同时创建灰度发布策略 svc_name最大长度51个字符创建Ingress。 kubectl

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 路由（Ingress） > ELB Ingress管理 > ELB Ingress高级配置示例
产品介绍 - 云容器引擎 CCE
产品介绍 - 云容器引擎 CCE

计费说明计费模式云容器引擎提供包年/包月、按需计费两种计费模式，以满足不同场景下的用户需求。关于计费模式的详细介绍请参见计费模式概述。包年/包月是一种预付费模式，即先付费再使用，按照订单的购买周期进行结算，因此在购买之前，您必须确保账户余额充足。按需计费是一种后付费模式，即先使用再付费，按照实际使用时长计费。

帮助中心 > 云容器引擎 CCE > 产品介绍
CCE创建的节点是否支持按需转包周期？ - 云容器引擎 CCE

CCE创建的节点是否支持按需转包周期？当前在CCE中购买节点时支持“按需计费”和“包年/包月”（按周期）计费。约束与限制按需节点池中的节点转成包年/包月时，需要将集群升级到v1.19.16-r40、v1.21.11-r0、v1.23.0-r0、v1.25.4-r0及以上版本。

帮助中心 > 云容器引擎 CCE > 常见问题 > 计费类
集群备份恢复 - 云容器引擎 CCE

集群备份恢复 CCE备份恢复为无状态和有状态应用的备份和恢复提供了一套可靠、安全、灵活且高效的解决方案。通过遵循CCE备份恢复的全流程指导，您可以顺利地完成应用的备份和恢复。建议在用户业务量小时执行备份和恢复操作。方案优势易用性：在应用备份和恢复阶段，已实现工具自动化。这些工具免安装，简单轻量且配置灵活。

帮助中心 > 云容器引擎 CCE > 最佳实践
按需节点转包年/包月 - 云容器引擎 CCE

按需节点转包年/包月当前在CCE中购买节点时支持“按需计费”和“包年/包月”（按周期）两种计费方式。按需计费的购买的节点可以转成按周期计费的节点。约束与限制按需节点池中的节点转成包年/包月时，需要将集群升级到v1.19.16-r40、v1.21.11-r0、v1.23.0-r0、v1

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 管理节点
组调度（Gang） - 云容器引擎 CCE

cpu: 500m limits: cpu: 500m schedulerName：设置为volcano，表示使用Volcano调度该工作负载。 scheduling.k8s.io/group-name：指定上一步中创建的PodGroup，示例为pg-test1。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > AI任务性能增强调度
工作负载异常：存储卷无法挂载或挂载超时 - 云容器引擎 CCE

roup。securityContext是kubernetes中的字段，即安全上下文，它用于定义Pod或Container的权限和访问控制设置。启动命令中是否包含ls、chmod、chown等查询或修改文件权限的操作。解决建议：请根据您的业务需求，判断是否需要修改。父主题：

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
为Nginx Ingress配置重定向规则 - 云容器引擎 CCE

ingress.kubernetes.io/permanent-redirect-code注解修改永久重定向的返回状态码。例如将永久重定向的状态码设置为308： nginx.ingress.kubernetes.io/permanent-redirect-code: '308' 在Nginx

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 路由（Ingress） > Nginx Ingress管理 > Nginx Ingress高级配置示例
管理自定义资源 - 云容器引擎 CCE

管理自定义资源自定义资源定义（Custom Resource Definition，CRD）是对Kubernetes API的扩展，当默认的Kubernetes资源无法满足业务需求时，您可以通过CRD对象来定义新的资源类别。根据CRD的定义，您可以在集群中创建自定义资源（Custom

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载
集群删除失败：安全组中存在残留资源 - 云容器引擎 CCE

集群删除失败：安全组中存在残留资源 CCE在删除集群时，会连接集群的kube-apiserver查询集群对接的周边资源信息，如Turbo集群对接的弹性网卡/弹性辅助网卡等，当CCE集群的状态为不可用，冻结，休眠等状态时，删除集群有可能会出现查询资源失败而导致集群删除失败的情况。故障现象

 帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群删除
PodTemplate - 云容器引擎 CCE
PodTemplate - 云容器引擎 CCE

PodTemplate 调度策略参数名取值范围默认值是否允许修改作用范围 affinity 无无允许 - 容忍策略参数名取值范围默认值是否允许修改作用范围 tolerations 无无允许 - Pod标签参数名取值范围默认值是否允许修改作用范围

 帮助中心 > 云容器引擎 CCE > 配置参考 > Pod
节点异常问题排查 - 云容器引擎 CCE

节点异常问题排查排查思路 CCE支持通过NPD插件排查节点异常问题，您也可以参考自主排查流程进行排查。若通过NPD插件排查和自主排查流程都无法解决问题，请提交工单排查。通过NPD插件排查 CCE提供节点故障检测NPD插件，NPD插件从1.16.0版本开始增加了大量检查项，能

 帮助中心 > 云容器引擎 CCE > 常见问题 > 节点
从Pod访问不同VPC网络的云服务 - 云容器引擎 CCE

可。对于问题二，您需要添加被访问服务子网与容器网段的路由。白名单如果被访问服务设置白名单，白名单未添加节点网段或容器网段。对于此类问题，您需要添加容器和节点网段到白名单。具体白名单的设置步骤，请在对应服务的帮助文档中查找。域名解析当访问外部域名时，Pod先使用集群的域

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络 > 从Pod访问集群外部网络
Fluent Bit内存崩溃漏洞公告（CVE-2024-4323） - 云容器引擎 CCE

Fluent Bit内存崩溃漏洞公告（CVE-2024-4323） Fluent Bit是一个功能强大、灵活且易于使用的日志处理和转发工具，适用于各种规模和类型的应用和系统（如Linux、Windows、嵌入式Linux、MacOS等）。Fluent Bit 是众多云提供商和企业

 帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

Kubeflow部署 Kubeflow的诞生背景基于Kubernetes构建一个端到端的AI计算平台是非常复杂和繁琐的过程，它需要处理很多个环节。如图1所示，除了熟知的模型训练环节之外还包括数据收集、预处理、资源管理、特性提取、数据验证、模型的管理、模型发布、监控等环节。对于一

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow

总条数： 667

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

资源与成本规划 - 云容器引擎 CCE

节点ARP表项超过限制 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）版本发布记录 - 云容器引擎 CCE

创建使用自定义指标的HPA策略 - 云容器引擎 CCE

为ELB Ingress配置自定义Header转发策略 - 云容器引擎 CCE

产品介绍 - 云容器引擎 CCE

CCE创建的节点是否支持按需转包周期？ - 云容器引擎 CCE

集群备份恢复 - 云容器引擎 CCE

按需节点转包年/包月 - 云容器引擎 CCE

组调度（Gang） - 云容器引擎 CCE

工作负载异常：存储卷无法挂载或挂载超时 - 云容器引擎 CCE

为Nginx Ingress配置重定向规则 - 云容器引擎 CCE

管理自定义资源 - 云容器引擎 CCE

集群删除失败：安全组中存在残留资源 - 云容器引擎 CCE

PodTemplate - 云容器引擎 CCE

节点异常问题排查 - 云容器引擎 CCE

从Pod访问不同VPC网络的云服务 - 云容器引擎 CCE

Fluent Bit内存崩溃漏洞公告（CVE-2024-4323） - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线