检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
多云集群 如何清理多云集群资源? 如何获取访问密钥AK/SK? 如何更新多云集群证书?
工作负载 创建工作负载 容器设置 管理工作负载 父主题: 集群联邦
服务与路由 服务与路由概述 服务(Service) 路由(Ingress) 父主题: 集群联邦
图2 参数修改 功能验证 登录UCS控制台。 如果是未加入舰队集群,直接单击集群名即可进入集群控制台。 如果是已加入容器舰队的集群,先进入对应容器舰队控制台,选择左侧 “集群管理”内的“容器集群”,再进入对应集群控制台。 左侧导航栏内选择“工作负载”,单击镜像创建。 选择可用镜
0,请提交工单,联系技术支持人员。详细了解HCE OS请参见HCE OS文档。 集群节点CPU架构暂不支持异构混部,请规划好集群的节点架构为X86或ARM64。 1.28.5及之后集群版本,支持HCE OS 2.0 ARM系统架构类型。 父主题: 安装本地集群的业务规划
要使用Metallb的集群。按照页面引导完成安装。 功能验证 进入UCS内的集群控制台。 如果是未加入舰队集群,直接单击集群名即可进入集群控制台。 如果是已加入容器舰队的集群,先进入对应容器舰队控制台,选择左侧 “集群管理”内的“容器集群”,再进入对应集群控制台。 左侧导航栏内选择“工作负载”,单击镜像创建。
升级集群proxy-agent组件 proxy-agent组件默认部署在用户集群kube-system命名空间下,当前在console控制台不支持升级,需要用户使用kubectl连接集群并升级proxy-agent组件版本,升级步骤如下: 获取kubeconfig并使用kubec
containerd 插件 集群中需要同时安装以下插件: volcano插件:1.10.1及以上版本 gpu-device-plugin插件:2.0.0及以上版本 步骤一:纳管并标记GPU节点 如果您的集群中已有符合基础规划的GPU节点,您可以跳过此步骤。 在集群中纳管支持GPU虚拟化的节点,具体操作步骤请参见纳管节点。
使用GPU虚拟化后,该GPU节点不再支持调度使用共享GPU资源的工作负载。 通过控制台创建GPU应用 登录UCS On Premises集群控制台。 单击集群名称进入集群,在左侧选择“工作负载”,在右上角单击“镜像创建”。 配置工作负载信息。在“容器配置>基本信息”中选择异构资源为GPU,然后选择资源使用模式:
完成GPU资源准备。 当前本地集群已创建GPU资源。 当前本地集群开启了监控能力。 GPU监控 登录UCS控制台,在左侧导航栏选择“容器智能分析”。 选择对应的集群并开启监控,详细操作请参照集群开启监控。 单击集群名称,进入“容器洞察”总览页面。 选择“仪表盘”,在“集群视图”旁单击“切换视
连接到集群,详情请参见通过kubectl连接集群。 约束与限制 当前不支持npu负载多容器能力。 通过控制台创建NPU应用 本节以创建无状态工作负载(Deployment)为例,说明通过控制台创建npu资源应用的方法。 登录UCS控制台,选择容器舰队,单击集群名称进入集群。 左侧导航栏中选择“工作负载
格遵循系统最小化安装。 集群安装检查项 在安装本地集群前,您需要对节点进行一系列检查。 表格中的命令适用于HCE与Redhat操作系统,若您使用Ubuntu操作系统,请将命令中的“yum”修改为“apt”。 检查类型 检查名 检查内容 检查通过标准 集群检查 节点架构检查 所有安装的Master节点架构检查
基础环境搭建 将集群注册到UCS并接入网络。具体操作请参见注册集群。 例如,将集群“ccecluster01”、“ccecluster02”注册到UCS的“ucs-group”容器舰队,并查看集群是否处于正常运行状态。 为集群所在舰队开通集群联邦,并确保集群已成功接入集群联邦。具体操作请参见集群联邦。
FullAccess权限的用户可进行集群联邦的开通、关闭操作。 集群联邦使用流程 集群联邦的使用流程如图2所示。 图2 集群联邦使用流程 集群联邦能力与容器舰队绑定,若您需要使用集群联邦进行多集群管理,请进行以下操作: 将需要管理的集群接入UCS,并将其加入容器舰队。 为容器舰队开通集群联邦能力,并通过kubectl连接集群联邦。
认证证书 合规证书 华为云服务及平台通过了多项国内外权威机构(ISO/SOC/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书
容器设置 容器基本信息 设置容器规格 设置容器生命周期 设置容器健康检查 设置环境变量 配置工作负载升级策略 配置调度策略(亲和与反亲和) 配置调度与差异化 父主题: 工作负载
表1 常用命令 命令 解释 config generator 提供集群、节点的创建模板 create 创建集群或者添加节点 delete 删除集群或者移除节点 get 获取本地集群信息 help 帮助信息 version ucs-ctl版本信息 参数说明 ucs-ctl config
Cilium是一种网络插件,支持BGP、eBPF等网络协议,更多内容请参见Cilium官方文档。 多云集群采用containerd作为容器引擎,如果节点操作系统已经安装containerd、runC组件,UCS将直接使用上述组件。 父主题: 安装多云集群的业务规划
否存在。如果容器的存活检查失败,集群会对该容器执行重启操作;若容器的存活检查成功则不执行任何操作。 就绪探针:readinessProbe,用于检查用户业务是否就绪,如果未就绪,则不转发流量到当前实例。一些程序的启动时间可能很长,比如要加载磁盘数据或者要依赖外部的某个模块启动完成
GPU视图 集群 集群-显存使用率 集群-算力使用率 节点-显存使用量 节点-显存使用率 节点-算力使用率 GPU卡-显存使用量 GPU卡-算力使用率 GPU卡-温度 GPU卡-显存频率 GPU卡-PCle带宽 XGPU视图 集群 集群--XGPU设备显存使用率 集群--XGPU设备算力使用率