云容器引擎 CCE-重调度(Descheduler):配置负载感知重调度策略
配置负载感知重调度策略
配置负载感知重调度(LoadAware)时,Volcano调度器需要同时开启负载感知调度,示例步骤如下。
- 登录CCE控制台,单击集群名称进入集群,单击左侧导航栏的“配置中心”,通过“调度配置”页面启用负载感知调度。详情请参见负载感知调度。
- 单击左侧导航栏的“插件中心”,在右侧找到Volcano调度器,单击“安装”或“编辑”。
- 在“参数配置”中修改高级配置,配置负载感知重调度策略。使用Volcano 1.11.21及更新版本,配置示例如下:
{ "colocation_enable": "", "default_scheduler_conf": { "actions": "allocate, backfill, preempt", "tiers": [ { "plugins": [ { "name": "priority" }, { "enablePreemptable": false, "name": "gang" }, { "name": "conformance" } ] }, { "plugins": [ { "enablePreemptable": false, "name": "drf" }, { "name": "predicates" }, { "name": "nodeorder" }, { "name": "usage", "enablePredicate": true, "arguments": { "usage.weight": 5, "cpu.weight": 1, "memory.weight": 1, "thresholds": { "cpu": 80, "mem": 80 } } } ] }, { "plugins": [ { "name": "cce-gpu-topology-predicate" }, { "name": "cce-gpu-topology-priority" }, { "name": "cce-gpu" } ] }, { "plugins": [ { "name": "nodelocalvolume" }, { "name": "nodeemptydirvolume" }, { "name": "node CS Ischeduling" }, { "name": "networkresource" } ] } ] }, "deschedulerPolicy": { "profiles": [ { "name": "ProfileName", "pluginConfig": [ { "args": { "ignorePvcPods": true, "nodeFit": true, "priorityThreshold": { "value": 100 } }, "name": "DefaultEvictor" }, { "args": { "evictableNamespaces": { "exclude": ["kube-system"] }, "metrics": { "type": "prometheus_adaptor" }, "targetThresholds": { "cpu": 80, "memory": 85 }, "thresholds": { "cpu": 30, "memory": 30 } }, "name": "LoadAware" } ], "plugins": { "balance": { "enabled": ["LoadAware"] } } } ] }, "descheduler_enable": "true", "deschedulingInterval": "10m" }
表1 集群重调度策略关键参数 参数
说明
descheduler_enable
集群重调度策略开关。
- true:启用集群重调度策略。
- false:不启用集群重调度策略。
deschedulingInterval
重调度的周期。
deschedulerPolicy
集群重调度策略,详情请参见表2。
表2 deschedulerPolicy配置参数 参数
说明
profiles.[].plugins.balance.enable.[]
指定集群重调度策略类型。
LoadAware:表示使用负载感知重调度策略。
profiles.[].pluginConfig.[].name
使用负载感知重调度策略时,会使用以下配置:
- DefaultEvictor:默认驱逐策略。
- LoadAware:负载感知重调度策略。
profiles.[].pluginConfig.[].args
集群重调度策略的具体配置。
- 对于DefaultEvictor配置,配置参数如下:
- ignorePvcPods:是否忽略挂载PVC的Pod,true表示忽略,false表示不忽略。该忽略动作未根据PVC类型(LocalPV/SFS/EVS等)进行区分。
- nodeFit:是否重调度时是否考虑节点上存在的调度配置,例如节点亲和性、污点等。true表示考虑,false表示不考虑。
- priorityThreshold:优先级设置。当Pod的优先级大于或者等于该值时,不会被驱逐。示例如下:
{ "value": 100 }
- 对于LoadAware配置,配置参数如下:
- evictableNamespaces:驱逐策略的适用命名空间,默认范围设置为除kube-system命名空间。示例如下:
{ "exclude": ["kube-system"] }
- metrics:监控数据采集方式,当前支持通过Custom Metrics API(prometheus_adaptor聚合数据)和Prometheus 直接查询。
Volcano 1.11.5至1.11.16版本推荐使用Prometheus 直接查询的方式获取监控数据,需填写prometheus server的地址信息,示例如下:
{ "address": "http://10.247.119.103:9090", "type": "prometheus" }
- targetThresholds:节点驱逐Pod的阈值,当节点上高于此阈值时,上面的Pod会被驱逐。示例如下:
{ "cpu": 60, "memory": 65 }
- thresholds:节点承载Pod的阈值,当节点低于此阈值时,表示该节点可以承载被驱逐的Pod。示例如下:
{ "cpu": 30, "memory": 30 }
- evictableNamespaces:驱逐策略的适用命名空间,默认范围设置为除kube-system命名空间。示例如下:
- 完成以上配置后,单击“确定”。