检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Turbo集群:拥有更高性能的云原生网络,提供云原生混部调度能力,可实现更高的资源利用率和更广的全场景覆盖。 关于集群类型差异详情,请参见集群类型对比。 计费模式 按需计费 选择集群的计费模式。 包年/包月:预付费模式,按订单的购买周期计费,适用于可预估资源使用周期的场景,价格比按需计费模式更优惠。
28版本进行定期的更新,并提供功能增强。 关于CCE集群版本的更新说明,请参见CCE集群版本发布说明。 参考链接 关于Kubernetes 1.28与其他版本的性能对比和功能演进的更多信息,请参考:Kubernetes v1.28 Release Notes 父主题: Kubernetes版本发布记录
28版本进行定期的更新,并提供功能增强。 关于CCE集群版本的更新说明,请参见CCE集群版本发布说明。 参考链接 关于Kubernetes 1.28与其他版本的性能对比和功能演进的更多信息,请参考:Kubernetes v1.28 Release Notes 父主题: Kubernetes版本发布记录
29版本进行定期的更新,并提供功能增强。 关于CCE集群版本的更新说明,请参见补丁版本发布说明。 参考链接 关于Kubernetes 1.29与其他版本的性能对比和功能演进的更多信息,请参考:Kubernetes v1.29 Release Notes 父主题: Kubernetes版本发布记录
29版本进行定期的更新,并提供功能增强。 关于CCE集群版本的更新说明,请参见补丁版本发布说明。 参考链接 关于Kubernetes 1.29与其他版本的性能对比和功能演进的更多信息,请参考:Kubernetes v1.29 Release Notes 父主题: Kubernetes版本发布记录
gle-numa-node”的节点,但由于单NUMA节点CPU总量均无法满足17U的申请值,因此该Pod无法调度。 图1 NUMA调度策略对比 调度优先级 不管是什么拓扑策略,都是希望把Pod调度到当时最优的节点上,这里通过给每一个节点进行打分的机制来排序筛选最优节点。 原则:尽
name: default-secret terminationGracePeriodSeconds: 60 配置容忍度(Toleration) 容忍度可以允许Pod在某些条件下被调度到节点上,即使这些节点上有污点(Taints)存在。比如,对于一个与节点本地状态有着深度绑定的应用而言,
台的权限依赖。 前提条件 给用户组授权之前,请您了解用户组可以添加的CCE系统策略,并结合实际需求进行选择,CCE支持的系统策略及策略间的对比,请参见CCE系统权限。若您需要对除CCE之外的其它服务授权,IAM支持服务的所有策略请参见系统权限。 拥有Security Admini
显卡上容器显存使用总量 GPU卡-算力使用率 百分比 每张GPU卡的算力使用率 计算公式:显卡上容器算力使用总量/显卡的算力总量 GPU卡-温度 摄氏度 每张GPU卡的温度 GPU-显存频率 赫兹 每张GPU卡的显存频率 GPU卡-PCle带宽 字节/秒 每张GPU卡的PCle带宽 指标清单
Pod 可以运行的节点,并简化配置。 开启/关闭 Pod容忍度限制插件 enable-admission-plugin-pod-toleration-restriction Pod容忍度限制插件允许通过命名空间设置 Pod 的容忍度的默认值和限制,为集群管理者提供了对 Pod 调度的精细控制,以保护关键资源。
0网络目前支持以下网卡预热策略:节点容器网卡动态预热策略和节点绑定容器网卡数总量高低水位策略(废弃中)。使用场景如下表所示: 表1 容器网卡预热策略对比表 容器网卡预热策略 节点容器网卡动态预热策略(默认策略) 节点绑定容器网卡数总量高低水位策略(废弃中) 管理策略 节点最少绑定容器网卡数
4-r0及以上版本的集群支持该参数。 默认:开启 Pod容忍度限制插件 enable-admission-plugin-pod-toleration-restriction Pod容忍度限制插件允许通过命名空间设置Pod的容忍度的默认值和限制,为集群管理者提供了对Pod调度的精细控制,以保护关键资源。
见创建单个迁移任务。完成迁移后,可参考对接已有对象存储挂载到应用实例。 目前对象存储迁移服务OMS支持亚马逊云(中国)、阿里云、微软云、百度云、华为云、金山云、优刻得、青云、七牛云、腾讯云平台的对象存储数据迁移到华为云对象存储服务OBS。 父主题: 实施步骤
排查项二:是否在实例上设置了tolerations 通过kubectl工具或单击对应工作负载后的“更多 > 编辑YAML”,检查工作负载上是不是设置了容忍度,具体请参见污点和容忍度。 排查项三:是否满足停止驱逐实例的条件 若属于小规格的集群(集群节点数小于50个节点),如果故障的节点大于总节点数的55%,实
使用场景 - 面向有云原生数字化转型诉求的用户,期望通过容器集群管理应用,获得灵活弹性的算力资源,简化对计算、网络、存储的资源管理复杂度。 适合对极致性能、资源利用率提升和全场景覆盖有更高诉求的客户。 适合具有明显的波峰波谷特征的业务负载,例如在线教育、电子商务等行业。 规格差异
在多个不同的集群中,使得计算资源无法共享,计算资源碎片数量增加。 节点规格没有跟随应用迭代而变化,资源分配率低:初期节点规格与应用规格匹配度较好,资源分配率较高;随着应用版本迭代,应用申请资源发生变化,与节点规格比例差异较大,使节点分配率降低,计算资源碎片数量增加。 业务“潮汐”
示。 约束限制: 创建节点时password字段需要加盐加密,具体方法请参见创建节点时password字段加盐加密。 取值范围: 密码复杂度要求: 长度为8-26位。 密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种。 密码不能包含用户名或用户名的逆序。
usage的已使用值对应 表3 温度及功率指标 指标名称 指标类型 单位 说明 DCGM_FI_DEV_GPU_TEMP Gauge 摄氏度 设备的当前GPU温度读数 DCGM_FI_DEV_POWER_USAGE Gauge W 设备的电源使用情况 父主题: 监控
示。 约束限制: 创建节点时password字段需要加盐加密,具体方法请参见创建节点时password字段加盐加密。 取值范围: 密码复杂度要求: 长度为8-26位。 密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种。 密码不能包含用户名或用户名的逆序。
TaskManager的总内存配置 parallelism.default: 2 # Flink作业的默认并行度为2 log4j-console.properties: |+ # 如下配置会同时影响用户代码和Flink的日志行为 rootLogger