检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本章节讲述为多云集群开启监控的操作流程。 前提条件 已将多云集群注册到UCS中,具体操作请参见多云集群概述。 准备网络环境 多云集群的数据接入方式支持公网接入,要求集群能够访问公网,具有弹性灵活、成本低、易接入的优势。如果对网络质量没有要求,只想采用更简便的方式接入,那么公网接入是个不错的选择。 公
基础软件规划 本地集群节点的操作系统、内核版本等基础软件规划需要符合表1中的要求。 表1 基础软件规划 系统架构 系统类型 网络模型 操作系统版本 内核版本限制 x86 Ubuntu 22.04 Cilium 检查命令:cat /etc/lsb-release DISTRIB_DESCRIPTION="Ubuntu
inx的工作负载,并配置相应的服务。 分别至对应的Region环境创建ELB实例。 网络配置中,开启IP类型后端(跨VPC后端)开关,VPC选择cce-cluster01所在的VPC,并新创建弹性公网IP。分别记录ELB实例1、ELB实例2的ID。 分别获取租户的两个区域的项目ID1、项目ID2。
基础软件规划 节点的操作系统、内核版本等基础软件需要符合表1中的版本要求。 表1 基础软件规划 系统架构 系统类型 网络模型支持 操作系统版本 内核版本限制 x86 Ubuntu 20.04 Cilium 检查命令:cat /etc/lsb-release DISTRIB_DESCRIPTION="Ubuntu
单击“创建路由”,选择刚刚所创建的ClusterIP类型的Service。路由配置相关操作请参见路由。 访问ingress服务,确认转发规则配置成功。 如果是使用LoadBalancer暴露的ingress服务,选择LoadBalancer的ingress服务进行集群外访问:
可访问联邦控制面的kubeconfig文件内容。关于如何下载满足要求的kubeconfig文件,请参见kubeconfig。 注意: 下载kubeconfig文件时,需要选择部署集群所在的VPC,或者通过云连接、对等连接等方式打通到集群网络的VPC。 若kubeconfig文件中的联邦控制面地址为域名,则需要在部署文件中配置hostAliaes。
当“协议”为HTTP时设置。指定健康检查的URL地址的路径。检查路径只能以/开头,长度范围[1-80]。 / 端口 健康检查端口号,取值范围[1,65535]。 健康检查默认使用业务端口(Service的NodePort和容器端口)作为健康检查的端口。 80 检查周期 每次健康检查响应的最大间隔时间。
图2 升级联邦版本 在弹出的升级告知中查看能够升级到的版本,并单击“下一步”进行升级前检查。 若通过检查,则单击“开始升级”进行升级,升级过程大约需要2分钟。 若未通过检查,请单击“排查原因”,参考文档进行错误修复。 右上角状态重新显示为“集群联邦能力已开通”表明升级成功,您可以在舰队基本信息中查看新的版本号。
网段约束 各集群所在的VPC网段不能冲突。 各集群所设置的容器网段不能冲突。 CCE网络插件实现会在路由表中添加路由,为了防止路由冲突造成网络无法联通,集群的VPC网段不能与其他集群的容器网段冲突。 操作步骤 登录云连接CC控制台,单击右侧“创建云连接”按钮。 弹出创建云连接界面,填写参数信息,单击“确定”,完成创建。
更新容器舰队的联邦对应的zone 功能介绍 更新容器舰队的联邦关联的zone URI PUT /v1/clustergroups/{clustergroupid}/associatedzones 表1 路径参数 参数 是否必选 参数类型 描述 clustergroupid 是 String
网格代理将会被安装在网格中每个Pod的Sidecar,通过在每个Pod独立的网络命名空间设置iptables规则,将应用服务的出入流量重定向到Sidecar的Envoy进程上,由Envoy进行流量路由。 图1 sidecar-proxy node-proxy 网格代理将会被安装在添加到该网格的每个集群的每个节
共享模式:多个Pod共享显卡,此处配置单个Pod使用显卡的百分比。不支持跨GPU分配,如50%单显卡只会分配到一张卡上。 GPU虚拟化模式: 显存:GPU虚拟化配置项。显存值单位为Mi,需为128的整数倍,最小值为128Mi,若配置的显存超过单张GPU卡的显存,将会出现无法调度状况。 算力:GP
JobSpec object spec是集合类的元素类型,您对需要管理的对象进行详细描述的主体部分都在spec中给出。UCS通过spec的描述来创建或更新对象。 status JobStatus object 运行状态信息。集合类的元素类型,用于记录对象在系统中的当前状态信息。 表4
本地集群管理流程 接入网络模式 UCS使用集群网络代理的连接方式,如图2 集群接入原理所示。您无需在防火墙上启用任何入方向端口,仅通过集群代理程序的方式即可在出方向与UCS服务建立会话。 本地集群接入网络的方法有两种,具有不同的优点: 公网接入:具有弹性灵活、成本低、易接入的优点。 私网接
格控制面的连接通过VPCEP实现,为便于管理,将VPCEP实例创建在该VPC中,如图所示: 如图,对于枢纽VPC下的集群,可以直接连接到网格控制面;对于同region中VPC1下的集群,选择创建VPC对等连接,使得两个VPC之间网络互通;对于跨region中VPC2下的集群,需要
如果您需要通过命令行创建,需要使用kubectl连接到集群,详情请参见通过kubectl连接集群。 约束与限制 当前不支持npu负载多容器能力。 通过控制台创建NPU应用 本节以创建无状态工作负载(Deployment)为例,说明通过控制台创建npu资源应用的方法。 登录UCS控制台,选择容器舰队,单击集群名称进入集群。
如何精细化管理集群联邦权限? 如果您在访问联邦资源时出现如下错误提示,说明您没有对应资源的操作权限,请您向您的管理员申请授予对应的权限,创建对应的Role/RoleBinding或者ClusterRole/ClusterRolebinding权限。 如果出现“no such host”问题,请按以下步骤进行排查:
可以设置相应的函数。目前提供的生命周期回调函数有启动命令、启动后处理、停止前处理,详情请参见设置容器生命周期。 健康检查:设置健康检查可以在容器运行过程中定时检查容器的健康状况,详情请参见设置容器健康检查。 环境变量:容器运行环境中设定的一个变量,通过环境变量设置的配置项不会随着
载对应的YAML文件。 kubectl edit deployment kube-state-metrics -nmonitoring 修改kube-state-metrics的启动参数。 例如需要采集Pod的所有labels时,则将kube-state-metrics的启动参数修改为:
服务健康 服务健康是通过对实际的访问情况进行统计来找出不健康的实例,属于被动型的健康检查。健康检查通过的实例,才会向服务端注册。 网格须开通AOM服务,否则无法查看服务健康。 操作步骤 登录UCS控制台,在左侧导航栏中单击“服务网格”。 单击服务网格名称,进入详情页。 在左侧导航