检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
DCGM_FI_DEV_DEC_UTIL Gauge % 解码器利用率 表2 内存指标 指标名称 指标类型 单位 说明 DCGM_FI_DEV_FB_FREE Gauge MB 表示帧缓存剩余数,帧缓存一般被称为显存 DCGM_FI_DEV_FB_USED Gauge MB 表示帧缓存已使用数,
加权最少连接就是在最少连接数的基础上,根据服务器的不同处理能力,给每个服务器分配不同的权重,使其能够接受相应权值数的服务请求。常用于长连接服务,例如数据库连接等服务。
查看最大PID数:sysctl kernel.pid_max 查看当前的最大PID:ps -eLf|awk '{print $2}' | sort -rn| head -n 1 查看占用SPID最多的前5个进程:ps -elT | awk '{print $4}' | sort |
s2:三控制节点的集群,即高可用集群,控制节点数为3。当某个控制节点故障时,集群仍然可用。 dec:表示专属云的CCE集群规格。例如cce.dec.s1.small表示小规模单控制节点的专属云CCE集群(最大50节点)。 small:表示集群支持管理的最大节点规模为50节点。
--workers:镜像搬迁的worker数量(并发数),默认是7。 $ .
非ELB直通Pod场景(CCE Standard集群或CCE Turbo集群使用共享型ELB实例的场景):ELB后端服务器是Service关联的目标Pod所在节点,此时每个节点的权重为 (集群流量权重/目标Pod总数)*该节点上的目标Pod数并向上取整。
在Kubernetes 1.28版本,kube-controller-manager添加了--concurrent-cron-job-syncs flag用来设置cron job controller的workers数。
使用该调度策略时,如果节点数小于实例数或节点资源不足,Pod将无法全部运行。 自定义亲和策略:根据Pod标签实现灵活的调度策略,支持的调度策略类型请参见表2。选择合适的策略类型后,可以添加相应的调度策略,参数详情请参见表3。
在Kubernetes 1.28版本,kube-controller-manager添加了--concurrent-cron-job-syncs flag用来设置cron job controller的workers数。
当负载使用对象存储数过多或大量读写对象存储文件时,常驻进程会占用大量内存,为保证负载稳定运行,建议负载使用的对象存储卷数量不超过其申请的内存GiB数量,如负载的申请的内存规格为4GiB,则建议其使用的对象存储数不超过4。 安全容器不支持使用对象存储。
约束与限制 CoreDNS域名解析插件正常运行或升级时,请确保集群中的可用节点数大于等于插件的实例数,且所有实例都处于运行状态,否则将导致插件异常或升级失败。 安装插件 本插件为系统默认安装,若因特殊情况卸载后,可参照如下步骤重新安装。
等待节点池创建成功后,节点池中默认节点数为0,您需要单击节点池所在行的“扩缩容”,为节点池创建节点。 设置本次扩容的节点数量为2,即在节点池中创建2个节点。 等待节点创建成功,创建节点预计需要5-10分钟左右,请耐心等待。
采集分片数(选择非“本地数据存储”时支持设置):当Prometheus的数据量很大时,您可以通过设置该参数,将数据分片到指定数量的Prometheus实例上存储和查询。增加分片数量可以使每个分片承担的数据量更少,从而增加指标的采集吞吐上限,但也会消耗更多的资源。
例如前缀为prefix-,后缀为-suffix,那么最终该节点池下的节点名称为prefix-nodepoolName-五位随机数-suffix。 自定义前后缀名称前后缀仅支持创建节点池时指定,不支持修改。 前缀支持以特殊字符结尾,后缀支持以特殊字符开头。
s2:三控制节点的集群,即高可用集群,控制节点数为3。当某个控制节点故障时,集群仍然可用。 dec:表示专属云的CCE集群规格。例如cce.dec.s1.small表示小规模单控制节点的专属云CCE集群(最大50节点)。 small:表示集群支持管理的最大节点规模为50节点。
图2 查看容器数 父主题: 工作负载异常问题排查
公测 / 11 新增1.19集群的节点池配置管理参数 CCE支持限制容器内文件句柄数、支持默认开启并修改PodPidsLimit、支持弹性计算周期可配置、支持容器mount F2FS&OverLayFS文件系统 商用 12 若干插件适配1.19版本集群及新增特性 插件市场中的若干插件支持在
Job 太多活跃Pod TooManyActivePods 次要 检查Job达到预定的Pod数后,是否还存在活动状态的Pod。 Job 太多成功Pod TooManySucceededPods 次要 检查Job达到预定的数量后,是否存在过多运行成功的Pod。
由于autoscaler原生支持异常扩容保护策略,会定期评估集群的可用节点比例,非Ready分类节点数统计比例超过45%比例会触发保护机制;而集群中任何存在该污点的节点都将从自动缩放器模板节点中过滤掉,记录到非Ready分类的节点中,进而影响集群的扩缩容。
当负载使用对象存储数过多或大量读写对象存储文件时,常驻进程会占用大量内存,为保证负载稳定运行,建议负载使用的对象存储卷数量不超过其申请的内存GiB数量,如负载的申请的内存规格为4GiB,则建议其使用的对象存储数不超过4。 安全容器不支持使用对象存储。