检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
高级配置(可选) 升级策略:指定工作负载的升级方式及升级参数,支持滚动升级和替换升级,详情请参见设置工作负载升级策略。 调度策略:通过配置亲和与反亲和规则,可实现灵活的工作负载调度,支持节点亲和。 节点亲和:提供常用的负载亲和策略,快速实现负载亲和部署。 不配置:不设置节点亲和策略。
时开启CPU和内存资源超卖。详情请参见动态资源超卖。 说明: 若集群版本不满足条件,资源超卖功能配置不会生效,详情请参见表1。 修改超卖资源配置时: 对于增加超卖资源类型,如超卖资源由CPU变为CPU、内存,此时可以随时添加。 对于减少超卖资源类型,如由CPU、内存变为仅超卖CP
DCGM_FI_DEV_MEM_COPY_UTIL Gauge % 表示内存带宽利用率。 以英伟达GPU V100为例,其最大内存带宽为900 GB/sec,如果当前的内存带宽为450 GB/sec,则内存带宽利用率为50%。 DCGM_FI_DEV_ENC_UTIL Gauge
开启GPU虚拟化时,在工作负载中设置nvidia.com/gpu等价于开启虚拟化GPU显存隔离,可以和显存隔离模式(即设置volcano.sh/gpu-mem.128Mi资源)的工作负载共用一张GPU卡,但不支持和算显隔离模式负载(即同时设置volcano.sh/gpu-mem
灵活的资源配置:节点池提供更加灵活的节点类型,允许您根据即时需求创建按需节点,也可以选择成本效益更高的包年/包月节点。 多元的实例选择:您可以基于业务需求,通过CPU和内存等参数筛选多种实例规格(如GPU实例),从而满足不同业务场景的需要。 高级的弹性伸缩:节点池支持开启弹性伸缩功能,您可以配置多种伸缩策略来
登录集群查看告警节点状态,确认异常后,优先将此节点设置为不可调度,并将业务pod调度到其他节点 节点的连接跟踪表已满 CCE 节点异常立即触发告警 登录集群查看告警节点状态,确认异常后,优先将此节点设置为不可调度,并将业务pod调度到其他节点 节点池资源售罄 CCE 节点池资源售罄立即告警 设置自动节点池切换或更换节点池规格
2。 登录ECS控制台,查看对应的弹性云服务器状态。 若弹性云服务器状态为“已删除”:请在CCE中删除对应节点,再重新创建节点。 若弹性云服务器状态为“关机”或“冻结”:请先恢复弹性云服务器,约3分钟后集群节点可自行恢复。 若弹性云服务器出现故障:请先重启弹性云服务器,恢复故障。
值小于1时,说明部分CPU资源在处理请求。 值等于1时,说明所有的CPU资源都在处理请求。 值大于1时,说明有部分线程在等待处理。 内存使用量 字节 不同模式的内存使用情况 内存使用率 百分比 主机内存使用率 磁盘写入速率 字节/秒 不同的磁盘的写入速率 磁盘读取速率 字节/秒 不同的磁盘的读取速率 磁盘空间使用
请根据不同的业务诉求选择节点类型,“节点规格”列表中将自动为您筛选该类型下可部署容器服务的规格,供您进一步选择。 本例中选择“弹性云服务器-虚拟机”,使用ECS弹性云服务器作为集群节点。 * 节点规格 请根据业务需求选择相应的节点规格。不同的节点规格差别请参见节点规格。 * 容器引擎 请根据业
化应用的全生命周期管理,为您提供高度可扩展的、高性能的云原生应用部署和管理方案。 为什么选择云容器引擎 云容器引擎深度整合高性能的计算(ECS/BMS)、网络(VPC/EIP/ELB)、存储(EVS/OBS/SFS)等服务,并支持GPU、NPU、ARM等异构计算架构,支持多可用区(Available
5500个实例。因此,您可以在命名空间中自行设置资源配额以确保所有命名空间内的实例总数不超过5500个,以避免资源过载。 请输入数值,不输入表示不限制该资源的使用。 若您需要限制CPU或内存的配额,则创建工作负载时必须指定CPU或内存请求值。 配置完成后,单击“确定”。 使用kubectl创建Namespace
Turbo集群 云原生网络2.0 v1.23.8-r0及以上 v1.25.3-r0及以上 暂不支持创建kata安全容器 仅支持弹性云服务器-虚拟机或弹性云服务器-物理机(机型为c6.22xlarge.4.physical或c7.32xlarge.4.physical) Kuberne
17 v1.23 适配NPU和安全容器 节点伸缩策略支持不设置步长 bug修复,自动移除已删除的节点池 设置优先调度 注册EmptyDir调度策略 修复停用节点伸缩策略时,低于缩容阈值的节点未触发缩容的问题 修改自定义规格的内存申请与限制 当没有开启弹性伸缩的节点池时上报无法伸缩的事件
合理调整CoreDNS副本数 建议您在任何情况下设置CoreDNS副本数应至少为2,且副本数维持在一个合适的水位以承载整个集群的解析。CCE集群安装CoreDNS插件的默认实例数为2。 CoreDNS使用资源的规格与解析能力相关,修改CoreDNS副本数量、CPU/内存的大小会对影响解析性能,请经过评估后再做修改。
节点(ECS)、绑定的弹性IP、带宽等资源仍将按各自的计费方式进行收费。如需关机节点,请在集群休眠提示框中勾选“关机集群下所有节点”或参见节点关机。 大部分节点关机后不再收费,特殊ECS实例(包含本地硬盘,如磁盘增强型,超高I/O型等)关机后仍然正常收费,具体请参见ECS计费模式。
进行扩缩容动作。 策略规则 基于指标(CPU利用率、内存利用率),对无状态工作负载的副本数进行弹性扩缩容。 基于周期(每天、每周、每月或每年的具体时间点),对无状态工作负载的副本数进行弹性扩缩容。 基于指标(CPU利用率、内存利用率)或周期(每天、每周、每月或每年的具体时间点),
表示程序被SIGKILL信号终止,常见的原因有如下几种: Pod中容器内存达到了其资源限制(resources.limits)。例如,内存溢出(OOM)会导致cgroup强制停止该容器。 运行容器的节点本身资源不足(OOM),则节点内核会选择停止一些进程来释放内存,可能会导致容器被终止。 容器健康检查失败,kubelet会停止该容器。
增大该权重值,优先均衡CPU资源。 1 内存权重 增大该权重值,优先均衡内存资源。 1 真实负载阈值生效方式 软约束:节点CPU、内存真实负载达到阈值后,新的任务优先被分配至真实负载未达到阈值的节点,但是该节点依然允许调度。 硬约束:节点CPU、内存真实负载达到阈值后,该节点不允许调度新的任务。
CCE突发弹性引擎(对接CCI)插件版本记录。 规格配置 用于配置插件负载的实例数及资源配额。 选择“系统预置规格”时,您可选择“单实例”或“高可用”规格。 选择“自定义规格”时,您可根据需求修改插件各个组件的副本数以及CPU/内存配置。 说明: CCE 突发弹性引擎 (对接 CCI)
nding Pods。 autoscaler决策优选节点池,评估Pod的CPU/内存比为1:4,节点池1中的节点规格为2U8G(CPU/内存比为1:4),节点池2中的节点规格为2U4G(CPU/内存比为1:2)。因此优选节点池1执行本次扩容。 topology-balance 组