检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如果在升级过程中出现不可预期的情况,可以基于备份为您快速恢复集群。
解决方案 当节点已出现thinpool空间耗尽时,可将部分业务迁移至其他节点实现业务快速恢复。但对于此类问题,建议采用以下方案从根因上解决问题: 方案1: 合理规划业务分布及数据面磁盘空间,避免和减少出现业务容器数*basesize > 节点thinpool空间大小场景。
在Master升级完成后尽量避免使用暂停升级功能,快速升级完Node节点。 若Node节点升级失败且无法修复,请尽快驱逐此节点上的应用,请联系技术支持人员,跳过此节点升级,在整体升级完毕后,重置该节点。
Standard/Turbo集群可观测性 Autopilot集群可观测性 模板市场 CCE Standard集群、CCE Turbo集群、CCE Autopilot集群均支持 CCE基于Kubernetes Helm标准的模板提供统一的资源管理与调度,高效地实现了模板的快速部署与后期管理
日志中会记录Evicted相关内容,搜索方法可参考如下命令: cat /var/log/cce/kubernetes/kubelet.log | grep -i Evicted -C3 排查思路 以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低频率原因排查,从而帮助您快速找到问题的原因
启用集群可观测能力 可观测性是保障集群可靠性、稳定性的基础,借助监控、告警和日志,集群管理员可以更好地理解集群的运行状况,快速发现异常并及时解决问题。 配置监控 通过控制台的集群总览页面查看控制节点监控信息。
v1.15.6-r1-20.3.0.2.B001-15.30.2 192.168.0.221 Ready <none> 7m v1.15.6-r1-20.3.0.2.B001-15.30.2 更多kubectl命令请参考kubectl 快速参考
节点亲和:提供常用的负载亲和策略,快速实现负载亲和部署。 不配置:不设置节点亲和策略。 指定节点调度:通过设置节点亲和(nodeAffinity)实现,指定工作负载的Pod部署的节点,若不指定,将根据集群默认调度策略随机调度。
表3 其他操作 操作 说明 操作步骤 扩容存储卷 通过CCE控制台快速扩容已挂载的专属存储。 在左侧导航栏选择“存储”,在右侧选择“存储卷声明”页签。单击PVC操作列的“更多 > 扩容”。 输入新增容量,并单击“确定”。
表3 其他操作 操作 说明 操作步骤 扩容存储卷 通过CCE控制台快速扩容已挂载的专属存储。 在左侧导航栏选择“存储”,在右侧选择“存储卷声明”页签。单击PVC操作列的“更多 > 扩容”。 输入新增容量,并单击“确定”。
示例如下: { "name": "log" } template 扩展配置 设置快速应答模板,AAAA表示IPv6解析请求,rcode控制应答返回NXDOMAIN,即表示没有IPv6解析结果。详情请参见template。
说明: 请合理设置该参数,值设置过低可能会在Pod刚进入就绪状态时,因CPU数据波动导致不恰当的扩容行为;而设置过高则可能导致在需要快速反应时HPA无法立即做出决策。
扩容专属存储卷 通过CCE控制台快速扩容已挂载的专属存储。 在左侧导航栏选择“存储”,在右侧选择“存储卷声明”页签。单击PVC操作列的“更多 > 扩容”。 输入新增容量,并单击“确定”。
表3 其他操作 操作 说明 操作步骤 扩容云硬盘存储卷 通过CCE控制台快速扩容已挂载的云硬盘。 仅按需计费的云硬盘支持扩容,包周期的云硬盘请单击卷名称,前往存储服务扩容。 在左侧导航栏选择“存储”,在右侧选择“存储卷声明”页签。单击PVC操作列的“更多 > 扩容”。
基于AOM服务的告警能力实现,提供集群内的告警快速检索、告警快速配置的能力,告警中心的指标类告警规则依赖云原生监控插件上报数据到AOM实例。
基于AOM服务的告警能力实现,提供集群内的告警快速检索、告警快速配置的能力,告警中心的指标类告警规则依赖云原生监控插件上报数据到AOM实例。
自动弹性伸缩 弹性伸缩功能可以根据需求自动调整应用程序的实例数和节点数,可以在流量高峰期间快速扩容,并在业务低谷时进行缩容以节约资源与成本。
表3 其他操作 操作 说明 操作步骤 扩容云硬盘存储卷 通过CCE控制台快速扩容已挂载的云硬盘。 仅按需计费的云硬盘支持扩容,包周期的云硬盘请单击卷名称,前往存储服务扩容。 在左侧导航栏选择“存储”,在右侧选择“存储卷声明”页签。单击PVC操作列的“更多 > 扩容”。
基于AOM服务的告警能力实现,提供集群内的告警快速检索、告警快速配置的能力,告警中心的指标类告警规则依赖云原生监控插件上报数据到AOM实例。
说明: 请合理设置该参数,值设置过低可能会在Pod刚进入就绪状态时,因CPU数据波动导致不恰当的扩容行为;而设置过高则可能导致在需要快速反应时HPA无法立即做出决策。