检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CPU 使用量:Pod已经使用的CPU核数。 CPU 申请量:Pod CPU Request值。 CPU 限制量:Pod CPU Limit值,使用量接近该值时容器的CPU资源会被限流,影响容器性能。
Targets采集配置 您可以在targets页面方便的查看您的采集任务状态,包含采集端点、标签、最新采集时间、最新采集耗时、最新采集Sample数、错误信息。 若您的云原生监控插件开启了分片,则会有多个采集实例,可在采集实例处进行切换。
参数名 取值范围 默认值 是否允许修改 作用范围 masters availabilityZone列表,用于指定master节点的可用区,该列表长度与集群的master节点数有关。
当负载使用对象存储数过多或大量读写对象存储文件时,常驻进程会占用大量内存,部分场景下内存消耗量参考表1,为保证负载稳定运行,建议负载使用的对象存储卷数量不超过其申请的内存GiB数量,如负载的申请的内存规格为4GiB,则建议其使用的对象存储数不超过4。
CCE集群管理规模指的是集群支持管理的最大节点数,仅供业务部署规划参考。通常情况下,集群不一定能达到所选规模的最大节点数,实际规模与集群中资源对象的类型、数量、大小以及外部对集群控制平面的访问量等多个因素相关。
排查项三:是否满足停止驱逐实例的条件 若属于小规格的集群(集群节点数小于50个节点),如果故障的节点大于总节点数的55%,实例的驱逐将会被暂停。此情况下Kubernetes将不再尝试驱逐故障节点的工作负载,具体请参见节点驱逐速率限制。
maxEmptyBulkDeleteFlag 否 int 空闲节点缩容并发数,默认值:10。 unremovableNodeRecheckTimeout 否 int 节点被判定不可缩容后能再次启动检查的时间间隔,单位分钟,默认值:5。
解决方案 避免服务中断可以从Deployment和Service两类资源入手: Deployment可以采用滚动升级的升级方式,为对各个实例逐个进行更新,而不是同时对所有实例进行全部更新,可以控制Pod的更新速度和并发数,从而确保了升级过程中业务不中断。
反亲和配置 支持竞价实例中断检测,中断前驱逐节点上的pod 0.8.10 1.17.4 v1.17 v1.19 v1.21 v1.23 v1.25 优化DiskHung检查项 0.8.10 1.17.3 v1.17 v1.19 v1.21 v1.23 v1.25 NPC最大可打污点节点数支持百分比配置
单故障最大节点隔离数:节点批量发生相同故障时,为避免雪崩效应,最多允许被隔离的节点数量。支持按照百分比或个数配置。 设置插件实例的部署策略。 调度策略对于DaemonSet类型的插件实例不会生效。
默认:0.1 次级节点迁移速率 secondary-node-eviction-rate 当某区域不健康时,在节点故障的情况下每秒删除Pod的节点数。该值默认设置为0.01,代表每100秒钟内至多从一个节点驱逐Pod。
单击ELB名称,并切换至“监控”,可以看到ELB的连接数为0。 使用kubectl命令行登录集群中的任意一个Nginx容器中,然后访问ELB的地址。 查询集群中的Nginx容器。
利用NAT网关实现公网访问,可以高效地支持高并发连接需求,适合请求量大、连接数多的应用场景。 图1 SNAT原理 前提条件 已创建一个CCE集群,具体操作步骤请参见创建集群。 在集群内已创建一个Pod,具体操作步骤请参见创建无状态负载(Deployment)。
仅支持变更集群最大节点规模,不支持变更控制节点数,且不支持降低集群规格。例如原集群规格为cce.s2.medium,仅支持变更至cce.s2.large及以上规格,不支持变更至cce.s2.small或cce.s1.medium。
单击ELB名称,并切换至“监控”,可以看到ELB的连接数为0。 使用kubectl命令行登录集群中的任意一个Nginx容器中,然后访问ELB的地址。 查询集群中的Nginx容器。
已有集群添加节点时,如果子网对应的VPC新增了扩展网段且子网是扩展网段,要在控制节点安全组(即集群名称-cce-control-随机数)中添加如下三条安全组规则,以保证集群添加的节点功能可用(新建集群时如果VPC已经新增了扩展网段则不涉及此场景)。
Node节点 修改集群内节点安全组 说明: 安全组命名规则:集群名称-cce-node-随机数 可能导致节点无法使用 参照新建集群的安全组进行修复,放通安全组。详情请参见集群安全组规则配置。
加权最少连接就是在最少连接数的基础上,根据服务器的不同处理能力,给每个服务器分配不同的权重,使其能够接受相应权值数的服务请求。常用于长连接服务,例如数据库连接等服务。
例如上面例子中的nginx,如果服务数为2,并部署在只有1个节点的集群上,就会有一个Pod无法创建,查询Pod日志会发现是由于端口占用导致nginx无法启动。
VPC网络 *控制节点数 3:三个控制节点,容灾性能好,在单个控制节点发生故障后集群可以继续使用,不影响业务功能。 1:单个控制节点,不建议在商用场景使用。