检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建使用自定义指标的HPA策略 Kubernetes默认的HPA策略只支持基于CPU和内存的自动伸缩,在复杂的业务场景中,仅使用CPU和内存使用率指标进行弹性伸缩往往无法满足日常运维需求。通过自定义指标配置工作负载HPA策略,可以根据业务自身特点,通过更多指标实现更灵活的弹性配置。
aarch64 解决方法 若您的集群版本为1.19.16-r0、1.21.7-r0、1.23.5-r0、1.25.1-r0及以上,请将节点重置为最新版本的操作系统即可修复该问题。 若您的集群版本不满足要求,请将集群升级到上述指定的版本后,再将节点重置为最新版本的操作系统。 父主题: 操作系统问题说明
CPU核数:扩容时,集群下所有节点CPU核数之和的上限,超过该值时将不再扩容。默认不限。 内存(GiB):扩容时,集群下所有节点内存之和的上限,超过该值时将不再扩容。默认不限。 统计节点、CPU和内存总数时,包含自定义节点池的不可用节点,但是不包含默认节点池中的不可用节点。 节点池扩容优先级
负载均衡器配置:后端云服务器组 后端云服务器组的负载均衡算法 服务对接的后端实例会在一个后端云服务器组中,此参数支持配置后端云服务器组的负载均衡算法。 参数名 取值范围 默认值 是否允许修改 作用范围 k8s annotation: kubernetes.io/elb.lb-algorithm
et持续高负荷运行,超过一定限度会出现日志转储,进而日志累积导致磁盘使用率过高。同时因为kubelet高负荷运行此时节点上容器创删等操作也会受影响。 解决方法 一般场景下,以8U16G节点、数据盘大小为100G为例,建议单容器的日志标准输出速率不超过512KB/s,节点上所有容器
服务发布到ELB,ELB的后端为何会被自动删除? 问题描述: 服务发布到ELB,工作负载已正常,但服务的pod端口未及时发布出来,ELB里的后端会被自动删除。 问题解答: 创建ELB时候,如果ELB健康检查失败,后端服务器组会删除,而且后续服务正常以后也不会添加。如果是更新已有的SVC时则不会删除。 添加删除
若集群非可用状态,如错误等,请参见当集群状态为“不可用”时,如何排查解决?。 若集群状态为“运行中”,而集群中部分节点状态为“不可用”,请执行2。 登录ECS控制台,查看对应的弹性云服务器状态。 若弹性云服务器状态为“已删除”:请在CCE中删除对应节点,再重新创建节点。 若弹性云服务器状态为“关机”或“冻结
工作负载状态正常但未正常工作 问题现象 Pod已经处于Running状态(查看Pod状态)但未正常工作,或者访问结果不符合预期。 问题原因 可能是您的部署描述YAML文件(例如 Pod、Deployment、StatefulSet等)存在错误。例如: 镜像版本未更新。您可能未使用
绑定的其他资源(云硬盘、带宽)不受关机影响,仍然正常计费。 基础资源(vCPU、内存)不再保留,当再次启动云服务器时,可能由于资源不足无法正常开机,请耐心等待,稍后再试。 基于专属资源或边缘可用区创建的实例,基础资源(vCPU、内存)仍会保留。 特殊情况下,如果您使用的弹性云服务器包含本地盘(如磁盘增强型
负载均衡器配置:后端服务器(组)配置 会话保持模式 监听器的会话保持类型 参数名 取值范围 默认值 是否允许修改 作用范围 k8s annotation: kubernetes.io/elb.session-affinity-mode HTTP_COOKIE、APP_COOKIE
容器性能。 内存相关指标 内存使用率:Pod的所有容器在不同的时间段内存使用总量占Pod的所有容器内存Limit总量。 物理内存使用量:Pod的所有容器物理内存使用总量。 内存WorkingSet使用量:Pod的所有容器的WorkingSet内存使用总量,即物理内存和缓存的总和。
conf目录,其中RuntimeMaxUse参数表示日志缓存的最大内存占用量。若不配置RuntimeMaxUse,长时间运行会占用较大内存。 修改节点系统参数的命令仅在使用公共镜像时有效,使用私有镜像时本文中提供的命令仅供参考。 修改节点RuntimeMaxUse 登录节点,查看/etc/systemd/journald
一个集群最多能创建多少个命名空间? 在Kubernetes集群中并没有明确的硬性限制来规定一个集群中可以创建的命名空间数量,但在实际使用过程中,可创建命名空间的数量会受到一些其他因素的限制。 资源限制 对于CCE集群来说,集群的规模越大,集群控制平面节点的资源也会相对变大,能够支
检查DNS设置。在运行应用程序之前,通过ping hostname命令确保DNS服务器已启动并正在运行。如果主机名是新的,则需要等待一段时间才能访问DNS服务器。 检查CoreDNS实例的CPU、内存使用率监控,确认是否已到达性能瓶颈,具体操作步骤请参见排查项二:检查CoreDNS实例是否已到达性能瓶颈。
节点内存使用率 = 节点的内存使用量除以节点的内存总量。 工作负载内存WorkingSet使用率:工作负载的所有Pod的WorkingSet内存使用总量 / 工作负载的所有Pod的内存限制值总和(未配置限制值时无数据) 工作负载物理内存使用率:工作负载的所有Pod的物理内存使用总量 /
CCE节点池内的节点变更规格后会有哪些影响? 问题背景 在ECS侧变更CCE节点池内节点的规格,前往CCE控制台同步云服务器状态,导致节点规格与节点池中设置的规格不一致。 问题影响 节点变更规格后,由于CPU、内存、网卡配额(可用IP地址)等节点参数发生变化,可能会导致该节点所在的节点池弹性伸缩行为与预期不符。 例如,
Pod相关指标 Pod CPU使用率:负载的每个Pod在不同的时间段的CPU使用量除以它们的CPU Limit量。 Pod 内存WorkingSet使用率:工作负载的每个Pod在不同的时间段的内存WorkingSet使用量占它们的内存限制值的比例。 Pod物理内存使用率:工作负载的每个Po
最小规格 内存:256MiB CPU:0.25Core 安全容器的CPU核数(单位为Core)与内存(单位为GiB)配比建议在1:1至1:8之间。例如CPU为0.5Core,则内存范围建议在512MiB-4GiB间。 无 容器引擎命令行 crictl Docker容器:docker
心分析Pod的内存运行状况,合理调整工作负载规格。 Pod的24小时内CPU使用率最大值是否超过80% 是 资源使用率过高,业务有过载风险,将导致业务时延增加,影响业务正常响应。可前往“监控中心 > Pod”查看对应实例指标状况,如果长时间达到瓶颈,可调整容器规格。 Pod的24小时内内存使用率最大值是否超过80%
总量之和 内存平均使用率 所选时间周期内,节点池的平均内存使用率。 内存使用率 = 节点池中节点内存使用总量 / 节点池中节点内存总量 内存平均使用量 所选时间周期内,节点池的内存平均使用量 内存闲置|申请量|总量 内存闲置:所选时间周期最后一天,节点池中节点的闲置内存之和 内存