搜索_华为云

CCE AI套件（Ascend NPU）版本发布记录 - 云容器引擎 CCE

修复了为业务容器自动挂载npu-smi失败的问题 2.1.5 v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 适配CCE v1.29集群新增静默故障码 2.0.9 v1.21 v1.23 v1.25 v1.27 v1.28 修复进程级故障恢复和给工作负载添加注解偶现失败问题

 帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
Kubernetes 1.30版本说明 - 云容器引擎 CCE

30版本中，Pod拓扑分布中的最小域特性进阶至GA。此特性允许通过Pod的minDomains字段配置符合条件的域的最小数量。负载拓扑约束匹配到的域的数量如果大于minDomains，则该字段没有影响；如果小于minDomains，则会将全局最小值（符合条件的域中匹配 Pod 的最小数量）设为

 帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 集群版本发布记录 > Kubernetes版本发布记录
CCE节点故障检测 - 云容器引擎 CCE

CCE节点故障检测插件（node-problem-detector，简称NPD）是一款监控集群节点异常事件的插件，以及对接第三方监控平台功能的组件。它是一个在每个节点上运行的守护程序，可从不同的守护进程中搜集节点问题并将其报告给apiserver。node-problem-detector可以作为DaemonSet运行，

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

Bool 默认值：false XGPU虚拟化模式的开关 gpu_driver_config 否 Map 针对单个节点池的GPU驱动的相关配置默认值：{} health_check_xids_v2 否 String 插件健康检查的GPU错误的范围默认值："74,79" inject_ld_Library_path

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
为负载均衡类型的Service指定多个端口配置健康检查 - 云容器引擎 CCE

timeout 否 String 健康检查的超时时间（秒）默认值：10，取值范围1-50 max_retries 否 String 健康检查的最大重试次数默认值：3，取值范围1-10 protocol 否 String 健康检查的协议默认值：取关联服务的协议取值范围：“TCP”、“UDP”或者“HTTP”

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 服务（Service） > 负载均衡（LoadBalancer）
Kubernetes 1.30版本说明 - 云容器引擎 CCE

30版本中，Pod拓扑分布中的最小域特性进阶至GA。此特性允许通过Pod的minDomains字段配置符合条件的域的最小数量。负载拓扑约束匹配到的域的数量如果大于minDomains，则该字段没有影响；如果小于minDomains，则会将全局最小值（符合条件的域中匹配 Pod 的最小数量）设为

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 集群版本发布说明 > Kubernetes版本发布记录
基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

设置自定义采集规则重新部署monitoring命名空间下的custom-metrics-apiserver工作负载。图3 重新部署custom-metrics-apiserver 重启后，可以通过以下指令查看对应的Pod的指标是否正常（注意替换命名空间和业务Pod名）。 # 查询指标 $ kubectl

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
优先级调度与抢占 - 云容器引擎 CCE

点弹性，以保证集群资源的按需供给，进而保证应用SLA。基于优先级抢占调度的亲和/反亲和示例在Pod间亲和场景中，不推荐Pod与比其优先级低的Pod亲和。如果pending状态的Pod与节点上的一个或多个较低优先级Pod具有Pod间亲和性，对较低优先级的Pod发起抢占时，会无法

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > 业务优先级保障调度
CCE集群纳管节点时的常见问题及排查方法？ - 云容器引擎 CCE

CCE集群纳管节点时的常见问题及排查方法？概述本文主要介绍纳管/添加已有的ECS实例到CCE集群的常见问题。纳管时，会将所选弹性云服务器的操作系统重置为CCE提供的标准镜像，以确保节点的稳定性，请选择操作系统及重置后的登录方式。所选弹性云服务器挂载的系统盘、数据盘都会在纳管时被格式化，请确保信息已备份。

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点创建
工作负载异常：存储卷无法挂载或挂载超时 - 云容器引擎 CCE

Pod所在节点与需挂载的SFS Turbo文件系统间的网络不通。检查PV中共享地址是否正确。获取PV的YAML，查看spec.csi.volumeAttributes下的everest.io/share-export-location字段值即为共享地址，正确的共享地址是指定的SFS Turbo文件系统的共享路径。

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
CCE集群新增节点时的问题与排查方法？ - 云容器引擎 CCE

CCE集群中新增节点时无法添加新的节点，提示子网剩余可用IP不足。原因分析：集群默认的节点子网网段较小，子网中的私有IP已用完，无法为节点分配新的私有IP。解决方法：场景一：VPC网段的IP未分配完您可以在创建节点时，在网络配置中选择一个新的节点子网。如果没有可用的节点子网，您可以前

 帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点创建
状态码 - 云容器引擎 CCE
状态码 - 云容器引擎 CCE

源特征与地址的列表用于用户终端（例如：浏览器）选择。 301 Moved Permanently 永久移动，请求的资源已被永久的移动到新的URI，返回信息会包括新的URI。 302 Found 资源被临时移动。 303 See Other 查看其它地址。使用GET和POST请求查看。

帮助中心 > 云容器引擎 CCE > API参考 > 附录
工作负载状态异常定位方法 - 云容器引擎 CCE

”。单击工作负载操作列的“日志”。您可以在日志上方切换实例和容器。 Pod监控检查方法登录CCE控制台。单击集群名称进入集群，在左侧选择“工作负载”。单击工作负载操作列的“监控”，即可查看Pod的CPU、内存、网络I/O等监控大盘。登录容器的方法登录CCE控制台。

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
CCE集群弹性引擎 - 云容器引擎 CCE

节点被判定不可缩容后能再次启动检查的时间间隔，单位分钟，默认值：5。 scaleDownUtilizationThreshold 否 double 判断节点可缩容的cpu和内存资源使用率门限，默认0.5。 maxNodesTotal 否 int 集群扩容的节点数量上限，默认1000。 coresTotal

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
GPU监控指标说明 - 云容器引擎 CCE

2（20%），可能有如下情况：在整个时间间隔内，有20%的SM的Tensor Core以100%的利用率运行。在整个时间间隔内，有100%的SM的Tensor Core以20%的利用率运行。在整个时间间隔的1/5时间内，有100%的SM上的Tensor Core以100%利用率运行。其他组合模式。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
快速入门 - 云容器引擎 CCE
快速入门 - 云容器引擎 CCE

您可以使用镜像快速创建一个可公网访问的单实例工作负载。本章节将指导您基于云容器引擎CCE快速部署Nginx容器应用，并管理该容器应用的全生命周期，以期让您具备将云容器引擎应用到实际项目中的能力。前提条件您需要创建一个至少包含一个4核8G节点的集群，且该节点已绑定弹性IP。集群是运行工作负载的逻辑分组，

帮助中心 > 云容器引擎 CCE > 快速入门
容器异常退出状态码 - 云容器引擎 CCE

镜像中用户定义的命令在本机权限不足。容器引擎与宿主机操作系统或硬件不兼容。 126 命令调用错误镜像中调用的命令无法执行，例如文件权限不足或文件不可执行。 127 找不到文件或目录无法找到镜像中指定的文件或目录。 128 无效的退出参数容器退出但未提供有效的退出代码，可能的原因有

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
为ELB Ingress配置自定义EIP - 云容器引擎 CCE

为ELB Ingress配置自定义EIP 通过CCE自动创建的带有EIP的ELB，可以通过添加Ingress的annotation（kubernetes.io/elb.custom-eip-id）完成ELB的EIP的自定义配置。前提条件已创建一个CCE Standard或CCE

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 路由（Ingress） > ELB Ingress管理 > ELB Ingress高级配置示例
CCE节点故障检测插件版本发布记录 - 云容器引擎 CCE

19 修复监控指标无法被获取的问题 0.7.1 1.14.4 v1.17 v1.19 适配ARM64节点部署适配containerd运行时节点 0.7.1 1.14.2 v1.17 v1.19 适配CCE v1.19集群新增支持Ubuntu操作系统和安全容器场景 0.7.1 1

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
通过CCE配置自定义告警 - 云容器引擎 CCE

CCEGroup 上述示例为kube-system空间下的CoreDNS设置一条名为“CoreDNS内存使用率超过百分之八十”的告警规则，告警等级为紧急。当内存使用率的最大值大于80%，且持续了1分钟时，给联系组CCEGroup内的所有告警联系人发送通知（通知方式为短信或邮件）。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心

总条数： 949

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CCE AI套件（Ascend NPU）版本发布记录 - 云容器引擎 CCE

Kubernetes 1.30版本说明 - 云容器引擎 CCE

CCE节点故障检测 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

为负载均衡类型的Service指定多个端口配置健康检查 - 云容器引擎 CCE

Kubernetes 1.30版本说明 - 云容器引擎 CCE

基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

优先级调度与抢占 - 云容器引擎 CCE

CCE集群纳管节点时的常见问题及排查方法？ - 云容器引擎 CCE

工作负载异常：存储卷无法挂载或挂载超时 - 云容器引擎 CCE

CCE集群新增节点时的问题与排查方法？ - 云容器引擎 CCE

状态码 - 云容器引擎 CCE

工作负载状态异常定位方法 - 云容器引擎 CCE

CCE集群弹性引擎 - 云容器引擎 CCE

GPU监控指标说明 - 云容器引擎 CCE

快速入门 - 云容器引擎 CCE

容器异常退出状态码 - 云容器引擎 CCE

为ELB Ingress配置自定义EIP - 云容器引擎 CCE

CCE节点故障检测插件版本发布记录 - 云容器引擎 CCE

通过CCE配置自定义告警 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线