搜索_华为云

CCE集群弹性引擎 - 云容器引擎 CCE

法运行。容忍策略容忍策略与节点的污点能力配合使用，允许（不强制）插件的 Deployment 实例调度到带有与之匹配的污点的节点上，也可用于控制插件的 Deployment 实例所在的节点被标记污点后插件的 Deployment 实例的驱逐策略。插件会对实例添加针对node

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 容器调度与弹性插件
工作负载监控 - 云容器引擎 CCE

的总字节数。网络总流入速率：负载的所有Pod的容器在不同的时间段的每秒钟接收的总字节数。网络发送丢包率：负载的所有Pod的容器在不同的时间段的发送丢失的数据包总量占发送的数据包总量的比例。网络接收丢包率：负载的所有Pod的容器在不同的时间段的接收丢失的数据包总量占接收的数据包总量的比例。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
选择GPU节点驱动版本 - 云容器引擎 CCE

选择CCE推荐的GPU驱动版本列表中提供的GPU驱动版本。若CCE推荐的驱动版本无法匹配您使用的CUDA Toolkit版本，必须使用非推荐的驱动版本，则需要您自行验证机型、系统及驱动版本间的配套兼容性。 CUDA Toolit版本兼容性所需的最低驱动版本（Linux x86_64）

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
获取集群升级前检查任务详情列表 - 云容器引擎 CCE

api版本，默认为v3 kind String 类型 metadata Metadata object 基本信息，为集合类的元素类型，包含一组由不同名称定义的属性 items Array of PrecheckClusterTask objects 集群检查任务列表表3 Metadata

帮助中心 > 云容器引擎 CCE > API参考 > API > 集群升级
GPU故障处理 - 云容器引擎 CCE
GPU故障处理 - 云容器引擎 CCE

/proc/xgpu/{GPU卡序号}/meminfo，注意替换命令中的{GPU卡序号}为步骤2获取的GPU卡序号，观测GPU虚拟化的可用显存。比较步骤2和步骤3的可用显存。由于GPU厂商的驱动程序，本身就会占用一定量的物理显存，量级在300MB左右，这属于正常现象。例如Tesla T4配套510

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
数据保护技术 - 云容器引擎 CCE

CCE通过多种数据保护手段和特性，保障数据的安全可靠。表1 CCE的数据保护手段和特性数据保护手段简要说明详细介绍服务发现支持证书配置 CCE集群中的应用服务支持使用HTTPS传输协议，保证数据传输的安全性，您可以根据需求创建四层或七层的访问方式来对接负载均衡器。七层证书配置

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 安全
公平调度（DRF） - 云容器引擎 CCE

在实际业务中，经常会遇到将集群稀缺资源分配给多个用户的情况，每个用户获得资源的权利都相同，但是需求数却可能不同，如何公平的将资源分配给每个用户是一项非常有意义的事情。调度层面有一种常用的方法为最大最小化公平分配算法（max-min fairness share），尽量满足用户中的最小的需求，然后将剩余的资源公平分配给剩下的用户。形式化定义如下：

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > AI任务性能增强调度
如何扩容容器的存储空间？ - 云容器引擎 CCE

工作负载下的容器组 Pod 占用的磁盘空间设置上限（包含容器镜像占用的空间）。合理的配置可避免容器组无节制使用磁盘空间导致业务异常。建议此值不超过容器引擎空间的 80%。该参数与节点操作系统和容器存储Rootfs相关，部分场景下不支持设置。更多关于容器存储空间分配的内容，请参考数据盘空间分配说明。

帮助中心 > 云容器引擎 CCE > 常见问题 > 存储管理
升级操作系统 - 云容器引擎 CCE

根据PDB规则保障关键业务的可用性。节点的系统盘和数据盘将会被清空，重置前请事先备份重要数据。节点重置会清除用户单独添加的K8S标签和K8S污点，可能导致与节点有绑定关系的资源（本地存储，指定调度节点的负载等）无法正常使用。请谨慎操作，避免对运行中的业务造成影响。升级操作完成后，节点将会自动开机。

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点池 > 管理节点池
管理节点标签 - 云容器引擎 CCE

管理节点标签节点标签可以给节点打上不同的标签，给节点定义不同的属性，通过这些标签可以快速的了解各个节点的特点。节点标签使用场景节点标签的主要使用场景有两类。节点管理：通过节点标签管理节点，给节点分类。工作负载与节点的亲和与反亲和：通过为节点添加标签，您可以使用节点亲和性

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 管理节点
插件高可用部署 - 云容器引擎 CCE

将插件中的工作负载部署至集群的工作节点。随着插件使用的普及化，业务对插件的稳定性、可靠性保证已成为基本诉求。目前CCE服务默认的插件部署策略是工作节点之间配置了强反亲和，AZ之间配置了弱反亲和的调度策略。本文提供了CCE插件调度策略的优化实践，业务可以根据自身可靠性的要求优化插件的部署策略。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 容灾
如何变更CCE集群中的节点规格？ - 云容器引擎 CCE

如何变更CCE集群中的节点规格？约束与限制节点池中的节点在ECS侧变更规格后，可能导致节点池弹性伸缩问题，详情请参见CCE节点池内的节点变更规格后会有哪些影响？。 CCE Turbo集群中的部分规格节点仅支持在CCE中创建，无法在ECS控制台变更规格，此种情况下调用ECS A

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 规格配置变更
修改节点进程 ID数量上限kernel.pid - 云容器引擎 CCE

进程 ID（PID）是节点上的一种基础资源，容易在尚未超出其它资源约束的时候触及进程ID数量上限，进而导致节点不稳定。您可以根据实际业务需求调整进程ID数量上限。默认kernel.pid_max说明 CCE在2022年1月底将1.17及以上集群的节点公共操作系统EulerOS

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维 > 节点系统参数优化
CCE集群创建失败的原因与解决方法？ - 云容器引擎 CCE

CCE集群创建失败的原因与解决方法？概述本文主要介绍在CCE集群创建失败时，如何查找失败的原因，并解决问题。详细信息集群创建失败的原因包括： ntpd没安装或者安装失败、k8s组件预校验不过、磁盘分区错误等，目前只能尝试重新创建，定位方法请参见定位失败原因。当前集群规模所需的底层资

 帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群创建
如何重置CCE集群中节点的密码？ - 云容器引擎 CCE

在左侧弹性云服务器列表中，选择待操作节点对应的云服务器，单击后方操作列中的“更多 > 关机”。待云服务器关机后，单击待操作节点后方操作列中的“更多 > 重置密码”，按照界面提示进行操作即可重置密码。密码重置完成后，单击待操作节点后方操作列中的“更多 > 开机”，单击后方的“远程登录”即可通过密码登录该节点。

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
K8s废弃资源检查异常处理 - 云容器引擎 CCE

[tolerate-unready-endpoints] 检查日志信息中所给出的service是否存在"tolerate-unready-endpoints"的annotation，如果存在则将其去掉，并在对应的service的spec中添加下列字段来替代该annotation： publishNotReadyAddresses:

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
审计与日志 - 云容器引擎 CCE
审计与日志 - 云容器引擎 CCE

Service，CTS），是华为云安全解决方案中专业的日志审计服务，提供对各种云资源操作记录的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。用户开通云审计服务后，系统将开始记录CCE资源的操作，并为您保存最近7天的操作记录。CTS支持记录的CCE操作请参见云审计服务支持CCE操作列表。

帮助中心 > 云容器引擎 CCE > 产品介绍 > 安全
为CCE Turbo集群配置默认容器子网 - 云容器引擎 CCE

CIDR）”中取消选择需要删除的容器子网，单击“确定”。删除容器子网属高危操作，请确保当前集群中没有已经使用待删除子网的网卡，包含Pod正在使用和集群预热的网卡。您可以复制需要删除的子网ID，在弹性网卡页面的“弹性网卡”和“辅助弹性网卡”列表中，通过子网ID进行筛选，如果筛选出的网卡“名称”或

 帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 容器网络 > 云原生网络2.0模型
通过节点池升级节点的GPU驱动版本 - 云容器引擎 CCE

通过节点池升级节点的GPU驱动版本如果您使用的CUDA库无法与当前的NVIDIA驱动版本匹配，您需要升级节点的驱动版本才可以正常使用GPU节点。建议您以节点池为粒度进行节点NVIDIA驱动版本的管理，创建应用时可调度到指定驱动版本的节点池，在升级驱动时，也可以根据节点池分批次控制升级。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
集群升级前检查 - 云容器引擎 CCE

PreCheckTask spec 是 PrecheckSpec object 参数解释： spec是集合类的元素类型，您对需要升级前检查的配置信息的主体部分都在spec中给出。CCE通过spec的描述来执行检查。约束限制：不涉及表3 PrecheckSpec 参数是否必选参数类型描述

 帮助中心 > 云容器引擎 CCE > API参考 > API > 集群升级

总条数： 948

上一页
1
...
40
41
42
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CCE集群弹性引擎 - 云容器引擎 CCE

工作负载监控 - 云容器引擎 CCE

选择GPU节点驱动版本 - 云容器引擎 CCE

获取集群升级前检查任务详情列表 - 云容器引擎 CCE

GPU故障处理 - 云容器引擎 CCE

数据保护技术 - 云容器引擎 CCE

公平调度（DRF） - 云容器引擎 CCE

如何扩容容器的存储空间？ - 云容器引擎 CCE

升级操作系统 - 云容器引擎 CCE

管理节点标签 - 云容器引擎 CCE

插件高可用部署 - 云容器引擎 CCE

如何变更CCE集群中的节点规格？ - 云容器引擎 CCE

修改节点进程 ID数量上限kernel.pid - 云容器引擎 CCE

CCE集群创建失败的原因与解决方法？ - 云容器引擎 CCE

如何重置CCE集群中节点的密码？ - 云容器引擎 CCE

K8s废弃资源检查异常处理 - 云容器引擎 CCE

审计与日志 - 云容器引擎 CCE

为CCE Turbo集群配置默认容器子网 - 云容器引擎 CCE

通过节点池升级节点的GPU驱动版本 - 云容器引擎 CCE

集群升级前检查 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线