检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装本地集群 单击“安装集群”,复制安装命令,并在“/root”目录(或其他可用目录)下执行命令。 图3 安装本地集群 前往UCS控制台刷新集群状态,集群处于“运行中”。 单击本地集群名称,进入集群控制台页面,对集群节点、工作负载等资源进行操作,操作正常无报错,即本地集群接入成功。
集群架构选择X86,在ARM节点上安装本地集群,则会安装失败报错: 集群架构选择ARM,在X86节点上安装本地集群,则会安装失败报错。 解决方案:集群节点CPU架构暂不支持异构混部,请确认集群架构与安装部署本地集群节点的cpu架构一致。 若集群架构选择X86,请选择X86节点上安装本地集群。 若集群架
左侧导航栏中选择“工作负载 > 无状态负载”,右上角单击“镜像创建”。 配置工作负载信息。在“容器配置>基本信息”中,异构资源选择“NPU”,并设置NPU配额。 配置其余信息,完成后,单击“创建工作负载”。返回无状态工作负载列表查看工作负载状态。 在工作负载列表中,待工作负载状态为“运行中”,工作负载创建成功。
如何手动清理本地集群节点? 使用须知 节点清理属于高危操作,会将节点上已安装的进程(包括kubernetes进程、containerd等)和数据(包括容器、镜像等)全部清理,一旦执行清理操作节点状态将不可恢复。因此,执行之前请确认节点是否已经不再被本地集群使用。 使用场景 本地集群ucs-ctl
如何更新本地集群ca/tls证书? 前提条件 本地集群各个组件运行正常。 集群各个节点处于ready状态。 操作步骤 下载ucs-ctl二进制工具,放到任一台本地集群的管控节点/root/ucs目录下。 将所有节点密码信息记录到表格中,并保存到二进制所在节点/root/ucs/update_cert
基础软件规划 本地集群节点的操作系统、内核版本等基础软件规划需要符合表1中的要求。 表1 基础软件规划 系统架构 系统类型 网络模型 操作系统版本 内核版本限制 x86 Ubuntu 22.04 Cilium 检查命令:cat /etc/lsb-release DISTRIB_DESCRIPTION="Ubuntu
本地集群 本地集群接入失败怎么办? 如何手动清理本地集群节点? 如何进行Cgroup降级? 虚拟机SSH连接超时怎么办? 本地集群如何扩容容器智能分析插件的存储磁盘? Master节点关机后集群控制台不可用怎么办? 节点扩容规格后未就绪怎么办? 如何更新本地集群ca/tls证书?
更好工作。关于MetalLB的详细信息请参见社区官方项目和MetalLB官网。 本章节,将从本地集群的视角出发,提供Metallb的创建及使用指导。 约束与限制 该文档仅适用于为UCS本地集群安装Metallb。 前提条件 按照网络管理Cilium介绍章节,已完成开启集群的BGP
NPU调度 NPU调度概述 NPU节点标签 创建NPU应用 父主题: 管理本地集群
GPU调度 GPU调度概述 准备GPU资源 创建GPU应用 监控GPU资源 父主题: 管理本地集群
监控GPU资源 本章介绍如何在UCS控制台界面查看GPU资源的全局监控指标。 前提条件 完成GPU资源准备。 当前本地集群已创建GPU资源。 当前本地集群开启了监控能力。 GPU监控 登录UCS控制台,在左侧导航栏选择“容器智能分析”。 选择对应的集群并开启监控,详细操作请参照集群开启监控。
NPU调度概述 UCS本地集群管理支持NPU异构资源调度能力。 可实现快速高效地处理推理和图像识别等工作。 NPU调度可以指定Pod申请NPU的数量,为工作负载提供NPU资源。 父主题: NPU调度
安装本地集群的业务规划 基础软件规划 数据规划 父主题: 本地集群
本地集群 本地集群概述 安装本地集群的业务规划 注册本地集群 安装本地集群 管理本地集群 父主题: UCS集群
本地集群 创建终端节点以私网接入本地集群 使用工作负载Identity安全访问云服务
创建NPU节点后,安装huawei-npu插件,需要给节点添加标签“accelerator/huawei-npu”,标签值可为空。 添加NPU节点标签 依次单击“本地集群>节点管理>选择节点>标签与污点管理”。 选择NPU节点,添加标签“accelerator/huawei-npu”,标签值可为空。 图1
r引擎内部数据结构的容器应用”。 参考创建无状态负载、创建有状态负载或创建守护进程集,在设置容器基本信息后,选择“数据存储”,在“本地存储”页签下单击添加。 图1 容器存储设置 设置添加本地磁盘参数,如表1。 表1 主机路径挂载 参数 参数说明 存储类型 主机路径(HostPath)。
GPU调度概述 工作负载支持使用节点GPU资源,GPU资源使用可以分为如下两种模式: GPU静态分配(共享/独享):按比例给Pod分配GPU显卡资源,支持独享(分配单张/多张显卡)和共享(部分显卡)方式。 GPU虚拟化:UCS On Premises GPU采用xGPU虚拟化技术
准备GPU资源 本文介绍如何在使用GPU能力前所需要的基础软件、硬件规划与准备工作。 基础规划 配置 支持版本 集群版本 v1.25.15-r7及以上 操作系统 华为云欧拉操作系统 2.0 系统架构 X86 GPU类型 T4、V100 驱动版本 GPU虚拟化功能仅支持470.57
虚拟机SSH连接超时怎么办? 由于部分虚拟机性能不满足使用需求,偶尔会出现SSH连接超时现象,此时可以通过修改虚拟机SSH配置来解决问题。 执行以下命令: vim /etc/ssh/sshd_config 按“i”进入编辑模式。 将useDNS的值设置为no。 按“ESC”,并输入:wq