检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CrashLoopBackOff 启动容器失败 重新启动容器失败 请参考工作负载异常:启动容器失败 Evicted 实例状态为“Evicted”,pod不断被驱逐 请参考工作负载异常:实例驱逐异常(Evicted) Creating 实例状态一直为“创建中” 请参考工作负载异常:一直处于创建中 Terminating
您可以自建存储类并配置回收策略和绑定模式,具体操作请参见通过控制台创建StorageClass。 访问模式 文件存储类型的存储卷仅支持ReadWriteMany,表示存储卷可以被多个节点以读写方式挂载,详情请参见存储卷访问模式。 文件存储 单击“选择文件存储”,您可以在新页面中勾选满足要求的文件存储,并单击“确定”。
m下Pod创建。 PodSecurityPolicy在Kubernetes v1.21版本中被弃用,并在Kubernetes v1.25中被移除。您可以Pod安全性准入控制器(Pod Security Admission)作为PodSecurityPolicy的替代,详情请参见Pod
选择极速文件存储对应的存储类为csi-sfsturbo。 访问模式 极速文件存储类型的存储卷仅支持ReadWriteMany,表示存储卷可以被多个节点以读写方式挂载,详情请参见存储卷访问模式。 极速文件存储 单击“选择极速文件存储”,您可以在新页面中勾选满足要求的极速文件存储,并单击“确定”。
配置示例 必须满足 requiredDuringSchedulingIgnoredDuringExecution 硬约束,即调度器只有在规则被满足的时候才能执行调度。 设置节点亲和调度(nodeAffinity) 设置工作负载亲和/反亲和调度(podAffinity/podAntiAffinity)
容忍策略与节点的污点能力配合使用,允许(不强制)插件的 Deployment 实例调度到带有与之匹配的污点的节点上,也可用于控制插件的 Deployment 实例所在的节点被标记污点后插件的 Deployment 实例的驱逐策略。 插件会对实例添加针对node.kubernetes.io/not-ready和node
增大该权重值,优先均衡CPU资源。 1 内存权重 增大该权重值,优先均衡内存资源。 1 真实负载阈值生效方式 软约束:节点CPU、内存真实负载达到阈值后,新的任务优先被分配至真实负载未达到阈值的节点,但是该节点依然允许调度。 硬约束:节点CPU、内存真实负载达到阈值后,该节点不允许调度新的任务。 硬约束 CPU真实负载阈值
节点优先级对其进行打分,用于缩容时决定Pod删除顺序。 在使用默认扩缩容优先级策略的情况下,扩容过程中Pod优先被调度到包周期的节点,其次被调度到按需计费的节点,最后被调度到virtual-kubelet节点(弹性至CCI);缩容过程中优先删除virtual-kubelet节点(
如果节点资源占用比较满,集群升级到v1.21.4-r0和v1.23.3-r0及以上版本之后可能会因为系统组件预留值变大而导致节点上的负载被驱逐。 CCE节点内存的总预留值等于系统组件预留值与Kubelet管理Pod所需预留值之和。 公式为:总预留值 = 系统组件预留值 + Kubelet管理Pod所需预留值
HPA策略:仅支持1.13及以上版本的集群创建。 1.19.10以下版本的集群中,如果使用HPA策略对挂载了EVS卷的负载进行扩容,当新Pod被调度到另一个节点时,会导致之前Pod不能正常读写。 1.19.10及以上版本集群中,如果使用HPA策略对挂载了EVS卷的负载进行扩容,新Po
相关操作:容忍度(Toleration) 容忍度应用于Pod上,允许(但并不要求)Pod 调度到带有与之匹配的污点的节点上。 污点和容忍度相互配合,可以用来避免 Pod 被分配到不合适的节点上。 每个节点上都可以应用一个或多个污点,这表示对于那些不能容忍这些污点的 Pod,是不会被该节点接受的。 在 Pod 中设置容忍度示例如下:
Worker之间的带宽直接影响了训练的效率。 Kubernetes默认调度器并不考虑Ps和Worker的这种逻辑关系,Ps和Worker是被随机调度的。如下图所示,2个TFJob(1个Ps + 2 Worker),使用默认调度器,有可能会出现(a)、(b)、(c)三种情况的任意一
配置案例2 随着集群状态,工作负载流量与请求的动态变化,节点的利用率也在实时变化,集群有可能会再次出现负载极端不均衡的情况,在业务Pod允许被驱逐重新调度的场景中,通过负载感知和热点打散重调度结合使用,可以获得集群最佳的负载均衡效果。关于热点打散重调度能力的使用请参见重调度(Descheduler)。
容忍策略与节点的污点能力配合使用,允许(不强制)插件的 Deployment 实例调度到带有与之匹配的污点的节点上,也可用于控制插件的 Deployment 实例所在的节点被标记污点后插件的 Deployment 实例的驱逐策略。 插件会对实例添加针对node.kubernetes.io/not-ready和node
多集群带来的资源碎片问题和因应用迭代带来的节点规格不匹配问题,帮助用户从繁杂的资源规划和版本迭代带来的变化中解脱出来。 资源分级管控 应用被调度到合适的运行环境后,如何来保障其所需要的资源呢? 基于Huawei Cloud EulerOS 2.0操作系统,从CPU、L3缓存、内存
设置云存储 在“服务配置”中单击添加服务,设置工作负载访问参数,设置完成后,单击“确定”。 本例中,将应用设置为“通过弹性公网IP的方式”被外部互联网访问。 Service名称:输入应用发布的可被外部访问的名称,设置为:apptest。 访问类型:选择“节点访问”。 服务亲和:
完成后,可在云原生成本治理的成本标签界面,看到CCE-Cluster-ID、CCE-Dynamic-Provisioning-Node标签被激活。 创建默认租户OBS桶:创建名称为cce-cost-{region}-{domain_id}的默认OBS桶,该OBS桶用来存储从费用中心导出的账单数据。
一并释放,节点如果未到期CCE不会对其做任何操作,相关数据会继续保留,相关资源会继续计费。请关注您账号下到期未续费集群,及时续费,防止节点被重装导致数据丢失。 若订单中存在主从关系的资源,需分别进行退订。 资源退订,相关注意事项请参见退订规则说明。 如果您正在退订使用中的资源,请
此可以将多个节点作为一个整体进行负载亲和性调度。 例如,某个拓扑域中的一个节点上运行着满足负载亲和性规则的Pod,则该拓扑域中的节点均可以被调度。 kubernetes.io/hostname 标签名 设置工作负载亲和/反亲和性时,填写需要匹配的工作负载标签。 该标签可以使用系统默认的标签,也可以使用自定义标签。
例如,存储卷名称前缀设置为“test”,则实际创建的底层存储名称test-{uid}。 访问模式 文件存储类型的存储卷仅支持ReadWriteMany,表示存储卷可以被多个节点以读写方式挂载,详情请参见存储卷访问模式。 加密 存储类为csi-nas时,可选择底层存储是否加密,使用加密时需要选择使用的加密密钥。