检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
准备GPU资源 本文介绍如何在使用GPU能力前所需要的基础软件、硬件规划与准备工作。 基础规划 配置 支持版本 集群版本 v1.25.15-r7及以上 操作系统 华为云欧拉操作系统 2.0 系统架构 X86 GPU类型 T4、V100 驱动版本 GPU虚拟化功能仅支持470.57
Server的工作负载的正常运行。为了帮助您快速识别和修复问题,资源概况中提供了API Server的总QPS和请求错误率指标。 资源消耗Top统计 在资源消耗TOP统计中,UCS服务会将CPU使用率和内存使用率排名前五的节点、无状态负载、有状态负载和Pod纳入统计范围,以帮助您识别资源消耗“大户”。 说明:
安装及验证 在UCS控制台成功添加集群后,集群状态将会显示为“等待安装并接入”,此时UCS并没有为集群安装Kubernetes软件以及打通与集群的网络连接,因此需要在集群中配置网络代理来接入网络并完成集群安装。 请在添加集群后的24小时内接入网络,您可单击右上角按钮查看详细的网络
行跨命名空间、跨集群、跨舰队的配置分发与配置管理的能力。对用户部署在各集群的业务提供实时的状态观测和消息通知,以确保应用出现问题时可以快速识别和定位,保障使用客户业务App的终端用户的使用体验和服务级别目标(SLO)达成。 Kustomize是一个Kubernetes应用程序配置
统计在UCS控制台集群列表上的CPU和内存分配率指标中,那么需要为这个节点打上“type:virtual-kubelet”标签,以便您准确识别集群资源分配情况。为集群节点打标签请参照为节点添加标签/污点。 父主题: UCS集群
安装多云集群的业务规划 基础软件规划 数据规划 父主题: 多云集群
on 扩展 Kubernetes API。 操作步骤 登录集群控制台。 在左侧导航栏中选择“自定义资源”,在右上角单击“YAML创建”。 在线编辑或选择导入自定义资源的YAML文件,单击“确定”。 其他操作: 单击操作列“查看YAML”,可查看自定义资源的YAML内容。 单击操作
安装本地集群的业务规划 基础软件规划 数据规划 父主题: 本地集群
已购买套餐包:但使用量超出资源包额度或对应集群类型与实际接入集群不同,进而产生按需费用,同时账户中的余额不足以抵扣产生的按需费用。请参考已购买资源包,为什么仍然产生按需计费识别产生按需计费的原因,并重新选择正确的资源包或保证账户中的余额充足。 未购买套餐包:按需计费模式下,UCS按每小时扣费,当余额不足,无法对上一个小时的费用进行扣费。
输入键、值。其中,“键”代表配置名;“值”代表配置内容。 配置标签 标签以Key/value键值对的形式附加到各种对象上(如工作负载、节点、服务等)。 标签定义了这些对象的可识别属性,用来对它们进行管理和选择。 输入标签键、值。 单击“确认添加” 。 配置完成后,单击“确定”。 使用配置项 配置项创建后,您可以在创
镜像仓库的用户名和密码。 标签 标签以Key/value键值对的形式附加到各种对象上(如工作负载、节点、服务等)。 标签定义了这些对象的可识别属性,用来对它们进行管理和选择。 单击“添加” 。 输入键、值。 配置完成后,单击“确认”。 密钥列表中会出现新创建的密钥。 使用密钥 密
成本高、传输时间长等难题。 若您的集群对接了对象存储,且需同步搬迁至云上,可以使用华为云对象存储迁移服务 OMS,帮助您将对象存储中的数据在线迁移至华为云对象存储服务 OBS。 若您的集群使用文件存储,迁移上云可以使用华为云弹性文件服务 SFS,具体请参见数据迁移。 数据库迁移
若您的集群使用了对象存储,跨云迁移可以使用华为云对象存储迁移服务 OMS。OMS服务是一种线上数据迁移服务,帮助您将其他云服务商对象存储中的数据在线迁移至华为云的对象存储服务 OBS中。 若您的集群使用了文件存储,跨云迁移可以使用华为云弹性文件服务 SFS,具体请参见数据迁移。 数据库迁移
详细说明请参见表2。 图1 创建对等连接 表2 创建对等连接参数说明 参数 是否必选 说明 对等连接名称 是 对等连接的名称。 由中文字符、英文字母、数字、中划线、下划线等构成,一般不超过64个字符。 本端VPC 是 本端集群的VPC,可以在下拉框中选择已有VPC。 本端VPC网段
FullAccess、UCS CommonOperations、UCS CIAOperations和UCS ReadOnlyAccess)进行识别。 对于多云集群,目前只有华为云账号可以执行集群注册的操作,暂不支持IAM系统策略。 父主题: 权限管理
配置项数据不可为空。 配置标签 标签以Key/value键值对的形式附加到各种对象上(如工作负载、节点、服务等)。 标签定义了这些对象的可识别属性,用来对它们进行管理和选择。 输入标签键、值。 单击“确认添加” 。 基于YAML创建配置项。在创建配置项页面右侧单击“YAML创建”。
该密钥数据不可为空。 密钥标签 标签以Key/value键值对的形式附加到各种对象上(如工作负载、节点、服务等)。 标签定义了这些对象的可识别属性,用来对它们进行管理和选择。 输入键、值。 单击“确认添加” 基于YAML文件创建密钥。在创建配置项页面右侧单击“YAML创建”。 若
多功能:支持基于系统指标变动、自定义指标变动和固定时间周期进行负载伸缩,实现复杂场景下的负载伸缩。 多场景:使用场景广泛,典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理。 负载伸缩实现机制 UCS的负载伸缩能力是由FederatedHPA和C
务的域名,这些服务的域名请参见地区及终端节点。 公网接入情况下,节点可自动识别默认DNS配置,需提前将DNS服务器上游设置为公网DNS,接下来无需再手动进行DNS服务器配置。 私网接入情况下,节点无法识别默认DNS配置,因此需提前配置VPCEP解析能力,详情请参考安装前准备。若您
驱动信息确认完毕,单击“搜索”按钮,会跳转到驱动信息展示页面,该页面会显示驱动的版本信息如图3,单击“下载”到下载页面。 图3 驱动信息 获取驱动软件链接方式分两种: 方式一:如图4,在浏览器的链接中找到url=/tesla/470.103.01/NVIDIA-Linux-x86_64-470