检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用集群联邦实现应用多活容灾 应用场景 为了应对云单点宕机故障,UCS的集群联邦提供多云多活应用、秒级流量接管能力。业务应用的实例可以多云多活的部署在不同云上的容器服务中,当云单点宕机故障发生时,集群联邦可以秒级自动完成应用实例的弹性迁移以及流量的切换,业务的可靠性大大提升。 多
本小节以部署于两个区域的CCE Turbo集群“cce-cluster01”、“cce-cluster02”为例,通过创建绑定至多地域ELB实例的MCI对象,结合华为云提供的DNS域名解析能力,部署支持跨Region容灾的服务公网访问入口,验证应用的高可用容灾能力。 将集群注册到UCS、接入网络并加入容器舰队,具体操作请参见注册集群。
集群中Kubernetes资源权限(RBAC授权) 集群中Kubernetes资源权限是基于Kubernetes RBAC能力的授权,管理员可授予用户针对集群内特定Kubernetes资源对象的操作权限,权限最终作用在舰队或未加入舰队的集群的命名空间上。 本章节以“只读权限”为例
集群监控概述 为集群开启监控才能确保您的集群处于实时守护状态。开启过程中,系统会自动为集群安装kube-prometheus-stack插件(简称普罗)和log-agent插件。kube-prometheus-stack通过使用Prometheus-operator和Promet
设置容器规格 操作场景 在创建工作负载时为添加的容器设置资源限制,可以对工作负载中每个实例所用的CPU配额、内存配额进行申请和限制。 配置说明 CPU配额: 表1 CPU配额说明 参数 说明 CPU申请 容器使用的最小CPU需求,作为容器调度时资源分配的判断依赖。只有当节点上可分配CPU总量
为集群添加标签与污点 UCS支持为集群打上不同的标签,来定义不同的属性,通过这些标签可以快速地了解各个集群的特点。而污点(taint)能够使集群排斥某些特定的Pod,从而避免Pod调度到该集群上,实现各集群负载的合理分配。 标签说明 通过给集群打上不同的标签,将集群进行分类,方便集群管理。
安装前检查 节点软件更新与升级要求 请关闭节点软件自动更新,请勿进行docker安装和containerd版本升级。禁用Ubuntu软件自动更新可参考Ubuntu Enable Automatic Updates Unattended Upgrades。 检查OS系统语言 安装本
收集数据面日志 费用说明 LTS创建日志组免费,并每月赠送每个账号一定量免费日志采集额度,超过免费额度部分将产生费用。 集群数据面组件说明 当前支持收集以下两种类型的数据面日志,每个日志流对应一个Kubernetes数据层面组件。关于这些组件的更多信息,请参见Kubernetes组件。
收集控制面组件日志 费用说明 LTS创建日志组免费,并每月赠送每个账号一定量免费日志采集额度,超过免费额度部分将产生费用。 约束与限制 华为云集群必须为v1.21.7-r0及以上补丁版本、v1.23.5-r0及以上补丁版本或1.25版本。 请确保云日志服务LTS资源配额充足,LTS的默认配额请参见基础资源。
收集Kubernetes审计日志 集群支持对用户开放集群Master节点的日志信息。在日志管理页面可以选择需要上报Kubernetes审计日志到云日志服务(LTS)。 约束与限制 华为云集群必须为v1.21.7-r0及以上补丁版本、v1.23.5-r0及以上补丁版本或1.25版本。
负载伸缩使用流程 本小节介绍FederatedHPA和CronFederatedHPA策略的使用流程。 FederatedHPA策略使用流程 FederatedHPA策略的使用流程如图1所示,具体流程如下: 图1 FederatedHPA使用流程 负载伸缩能力基于部署在多集群上的
容忍策略 容忍策略允许调度器将Pod调度至带有对应污点的节点上,需要与节点污点配合使用。每个节点可以添加一个或多个污点,对于未设置节点容忍策略的Pod,调度器会根据集群上的污点效果进行选择性调度,以避免Pod被分配到不合适的节点上。 通过控制台配置容忍策略 登录UCS控制台。 在
重试 开启重试,服务访问失败时会自动重试,提高总体访问成功率和质量。 YAML设置如下: apiVersion: networking.istio.io/v1beta1 kind: VirtualService metadata: name: ratings-route spec:
熔断 在更新流量策略内容时,可选择是否开启。熔断器是提高微服务韧性的一个非常典型的手段,会自动隔离不健康的实例,提高服务整体访问成功率。 熔断器跟踪服务实例的访问状态,通过跟踪一段时间内服务实例的访问请求判定其健康状况,将不健康的实例从连接池中隔离,从而提高服务总体的访问成功率,适用于HTTP和TCP服务。
noupdateserviceaccount 基本信息 策略类型:合规 推荐级别:L1 生效资源类型:* 参数: allowedGroups:数组 allowedUsers:数组 作用 拒绝白名单外的资源更新ServiceAccount。 策略实例示例 以下策略实例展示了策略定义
表3 请求Body参数 参数 是否必选 参数类型 描述 projectID 是 String 项目id vpcID 是 String 虚拟私有云id,必须位于上述项目中 subnetID 是 String 子网的网络id,必须位于上述虚拟私有云中 响应参数 状态码: 201 表4 响应Body参数
关闭容器集群联邦 功能介绍 关闭容器舰队联邦 URI DELETE /v1/clustergroups/{clustergroupid}/federations 表1 路径参数 参数 是否必选 参数类型 描述 clustergroupid 是 String 容器舰队id 请求参数
使用流量分发实现应用故障倒换 应用场景 在分布式集群场景下,为了给用户提供低延迟的服务,应用可能部署在不同区域、不同厂商的云端上,在某个地区集群发生故障时,该地区的用户访问也随之会受到影响。利用UCS的流量管理和应用数据管理功能,可以实现多云多集群场景下的应用故障倒换、调度和迁移,故障倒换方案示意如图1所示。
GPU调度 GPU调度概述 准备GPU资源 创建GPU应用 监控GPU资源 父主题: 管理本地集群
FederatedHPA策略 FederatedHPA工作原理 安装指标采集插件 创建FederatedHPA策略以按指标扩缩工作负载 配置FederatedHPA策略以控制扩缩速率 管理FederatedHPA策略 父主题: 多集群负载伸缩