检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
API来实现工作负载弹性伸缩。 创建CustomedHPA策略后,不支持将已关联的工作负载修改为其他工作负载。 创建CustomedHPA策略 在CCE控制台,单击集群名称进入集群。 单击左侧导航栏的“工作负载”,在目标工作负载的操作列中单击“弹性伸缩”。 策略类型选择“CustomedHPA策略”,并填写策略参数。
在CCE控制台也可以设置镜像拉取策略,在创建工作负载时设置“更新策略”:勾选表示总是拉取镜像(Always),不勾选则表示按需拉取镜像(IfNotPresent)。 图1 设置更新策略 建议您在制作镜像时,每次制作一个新的镜像都使用一个新的Tag,如果不更新Tag只更新镜像,当拉取策略选择为IfNo
重建的Pod处于Pending状态无法调度。 为同一个负载的配置多个VPA可能会出现行为不一致的现象。 创建VPA策略 使用kubectl连接集群,详情请参见通过kubectl连接集群。 部署一个示例工作负载。如果已有工作负载可忽略本步骤。 kubectl create -f hamster
内存1000Mi资源,每1000伸缩策略CPU 100m,内存500Mi。 AHPA需要对工作负载历史数据进行分析处理,需要额外内存,通常场景下建议每100个AHPA策略配置CPU 100m、内存 300Mi。 创建AHPA策略后,不支持将已关联的工作负载修改为其他工作负载。 AHPA策略不支持和CustomedHPA策略同时启用。
单击左侧导航栏的“工作负载”,在目标工作负载的操作列中单击“更多 > 弹性伸缩”。 图1 工作负载弹性伸缩 策略类型选择“HPA+CronHPA策略”,并启用HPA策略,填写HPA策略配置参数。 本文中仅介绍HPA策略,如需启用CronHPA策略,请参见创建CronHPA定时策略。 图2 启用HPA策略
为什么Pod实际负载在节点上分布不均匀 kube-scheduler调度器在分配Pod时不会考虑应用的实际负载,如果应用负载不均匀可能导致某些节点的负载较高,而其他节点的负载较低。 Volcano调度器支持使用负载感知调度功能,感知集群内节点CPU、Memory的负载情况,将Pod
e的污点。 图1 添加污点 创建GPU/NPU工作负载时,在高级配置中,手动添加容忍策略,容忍该污点。 图2 容忍策略 普通工作负载创建时,无需添加容忍策略。由于未容忍该污点,则不会被调度到GPU/NPU节点。 父主题: 调度策略
23及以上。 集群中需提前部署可用的工作负载用于对外提供访问。若您无可用工作负载,可参考创建无状态负载(Deployment)、创建有状态负载(StatefulSet)或创建守护进程集(DaemonSet)部署工作负载。 为提供对外访问的工作负载配置Service,ELB Ingre
String 请根据不同的应用场景和功能需求选择合适的负载均衡器类型。 取值如下: union:共享型负载均衡。 performance:独享型负载均衡,仅支持1.17及以上集群,详情请参见共享型弹性负载均衡与独享型负载均衡的功能区别。 说明: 负载均衡类型的服务对接已有的独享型ELB时,该
CCE集群中工作负载镜像的拉取策略有哪些? 容器在启动运行前,需要镜像。镜像的存储位置可能会在本地,也可能会在远程镜像仓库中。 Kubernetes配置文件中的imagePullPolicy属性是用于描述镜像的拉取策略的,如下: Always:总是拉取镜像。 imagePullPolicy:
高级配置(可选) 升级策略:指定工作负载的升级方式及升级参数,支持滚动升级和替换升级,详情请参见设置工作负载升级策略。 调度策略:通过配置亲和与反亲和规则,可实现灵活的工作负载调度,支持负载亲和与节点亲和。 负载亲和:提供常用的负载亲和策略,快速实现负载亲和部署。 不配置:不设置负载亲和策略。
插件安装的命名空间:选择Ingress控制器所在的命名空间。 负载均衡器:支持对接共享型或独享型负载均衡实例,如果无可用实例,请先创建。负载均衡器需要拥有至少两个监听器配额,且端口 80 和 443 没有被监听器占用。 选择共享型负载均衡实例,支持开启“获取客户端IP”功能,开启后使用Nginx
单击左侧导航栏的“工作负载”,在目标工作负载的操作列中单击“更多 > 弹性伸缩”。 图2 工作负载弹性伸缩 策略类型选择“HPA+CronHPA策略”,启用HPA策略,并同时启用CronHPA策略。 此时CronHPA会定时调整HPA策略的最大和最小实例数。 设置HPA策略,详情请参见创建HPA策略。
)只是其中一项,还有其他打分项会导致分布不均匀。详细的调度说明请参见Kubernetes 调度器和调度策略。 想要让多个Pod尽可能的均匀分布在各个节点上,可以考虑使用工作负载反亲和特性,让Pod之间尽量“互斥”,这样就能尽量均匀的分布在各节点上。 示例如下: kind: Deployment
如何查看Pod是否使用CPU绑核? 以4U8G节点为例,并提前在集群中部署一个CPU request为1,limit为2的工作负载。 登录到节点池中的一个节点,查看/var/lib/kubelet/cpu_manager_state输出内容。 cat /var/lib/kubel
在左侧导航栏中单击“工作负载”,单击工作负载名称查看详情。 在该工作负载详情页的“弹性伸缩”页签下可以看到弹性伸缩策略,您在“策略”页面配置的伸缩策略也会在这里显示。 您可以在操作列中单击对应的按钮对弹性伸缩策略进行管理。 弹性伸缩策略类型 操作 HPA策略 事件:查看HPA策略事件页签,若
class String 请根据不同的应用场景和功能需求选择合适的负载均衡器类型。 取值如下: union:共享型负载均衡。 performance:独享型负载均衡,仅支持1.17及以上集群,详情请参见共享型弹性负载均衡与独享型负载均衡的功能区别。 v1.9及以上 kubernetes.io/elb
io/unschedulable = : NoSchedule的污点。 uncordon:将节点标记为可调度。 更多说明请参考kubectl文档。 父主题: 调度策略
调度策略:通过配置亲和与反亲和规则,可实现灵活的工作负载调度,支持负载亲和与节点亲和。 负载亲和:提供常用的负载亲和策略,快速实现负载亲和部署。 不配置:不设置负载亲和策略。 优先多可用区部署:通过设置Pod间反亲和(podAntiAffinity)实现,优先将工作负载的Pod调度到不同可用区的节点上。
io/not-ready:NoExecute 当Pod对这些污点存在容忍策略时,Pod不会进行重新调度,因此需要检查Pod对污点的容忍策略。 解决方案 通过查询Pod或者工作负载的yaml,查看容忍策略。一般情况下,工作负载的容忍度设置由以下字段组成: tolerations: - key: