检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户权限 用户管理(边缘云) 用户管理(公有云) 角色管理 用户角色授权 工厂员工管理 父主题: 系统管理
准备工作 准备资源 准备数据 准备权重 准备代码 准备镜像 准备Notebook(可选) 父主题: 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导(6.3.907)
准备镜像 准备大模型推理适用的容器镜像,包括获取镜像地址,了解镜像中包含的各类固件版本,配置Standard物理机环境操作。 镜像版本 本教程中用到基础镜像地址和配套版本关系如下表所示,请提前了解。 表1 基础容器镜像地址 镜像用途 镜像地址 配套版本 基础镜像 swr.cn-southwest-2
准备镜像 准备训练Llama2-13B模型适用的容器镜像,包括获取镜像地址,了解镜像中包含的各类固件版本,配置Standard物理机环境操作。 镜像地址 本教程中用到的训练的基础镜像地址和配套版本关系如下表所示,请提前了解。 表1 基础容器镜像地址 镜像用途 镜像地址 配套版本 训练基础镜像
准备镜像 准备大模型推理适用的容器镜像,包括获取镜像地址,了解镜像中包含的各类固件版本,配置Standard物理机环境操作。 镜像版本 本教程中用到基础镜像地址和配套版本关系如下表所示,请提前了解。 表1 基础容器镜像地址 镜像用途 镜像地址 配套版本 基础镜像 swr.cn-southwest-2
场景介绍 方案概览 本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件,为用户提供了常见主流开源大模型在ModelArts Standard上的预训练和全量微调方案。 本方案目前仅适用于部分企业客户,完成本方案的部署,需要先联系您所在企业的华为方技术支持。
预训练 前提条件 已上传训练代码、训练权重文件和数据集到OBS中,具体参考代码上传至OBS。 Step1 创建训练任务 创建训练作业,并自定义名称、描述等信息。选择自定义算法,启动方式自定义,以及选择上传的镜像。 代码目录选择:OBS桶路径下的llm_train/AscendSpeed代码目录。
准备权重 获取对应模型的权重文件,获取链接参考支持的模型列表和权重文件。 在创建的OBS桶下创建文件夹用以存放权重文件,例如在桶中创建文件夹。将下载的权重文件上传至OBS中,得到OBS下数据集结构。此处以qwen-14b举例。 obs://${bucket_name}/${folder-name}/
配置Workflow的输入输出目录 功能介绍 统一存储主要用于工作流的目录管理,帮助用户统一管理一个工作流中的所有存储路径,主要分为以下两个功能: 输入目录管理:开发者在编辑开发工作流时可以对所有数据的存储路径做统一管理,规定用户按照自己的目录规划来存放数据,而存储的根目录可以根
配置仪表盘查看指标数据 Grafana中可以自定义配置各种视图的仪表盘,ModelArts也提供了针对集群的配置模板。本章节通过使用ModelArts提供的模板查看指标和创建Dashboards查看指标的方式,说明如何进行仪表盘配置。Grafana的更多使用请参考Grafana官方文档。
(Windows版) 第三方名称:华为云计算技术有限公司 收集个人信息类型: 1.创建/发起会议所需的会议信息(会议主题、与会人名称、与会者手机号码、与会者邮箱、部门名称、主持人/来宾口令、会议描述) 2.加入会议所需的的鉴权信息(会议ID、会议口令或会议链接)、与会信息(与会者名称)
SDK (Mac版) 第三方名称:华为云计算技术有限公司 收集个人信息类型: 1. 创建/发起会议所需的会议信息(会议主题、与会人名称、与会者手机号码、与会者邮箱、部门名称、主持人/来宾口令、会议描述) 2. 加入会议所需的的鉴权信息(会议ID、会议口令或会议链接)、与会信息(与会者名称)
推送AKSK鉴权 支持业务方接收状态报告/上行短信/批量状态报告时开启/关闭AKSK鉴权。开启后平台的推送会带有用于鉴权的字段,可根据该字段对平台发送的HTTP消息鉴权,具体请参考推送AKSK验证。 当开启推送AKSK鉴权功能时,必须配置推送AK和推送SK。配置后生效时间大概需要5分钟
配置防火墙与云平台对接(V600R023C00SPC100及其后续版本) 前提条件 已加载了云服务特性包。 已完成了云服务购买。 已通过华为乾坤控制台或华为乾坤APP完成设备添加,具体操作请分别参见: 华为乾坤控制台:设备。 华为乾坤APP:使用华为乾坤APP(首页)。 操作步骤
# 基于AscendSpeed的训练代码 |──ascendcloud_patch/ # 针对昇腾云平台适配的功能补丁包 |──scripts/ # 训练需要的启动脚本
# 基于AscendSpeed的训练代码 |──ascendcloud_patch/ # 针对昇腾云平台适配的功能补丁包 |──scripts/ # 训练需要的启动脚本
提交问卷。 首次登录运行态应用时,单击请通过邮箱或手机号,根据界面提示完成密码的重置。 图3 应用运行态登录页 图4 获取验证码 图5 输入已获取的验证码 图6 完成密码重置 若步骤2:添加表单中,“表单发布 > 基础设置”选择“公开发布”(如图7),则表单将公开发布给应用外的
开启登录保护后,IAM用户登录时,除了在登录页面输入用户名和密码外(第一次身份验证),还需要在登录验证页面输入验证码(第二次身份验证),该功能是一种安全实践,建议开启登录保护,多次身份认证可以提高账号安全性。 您可以选择通过手机、邮箱、虚拟MFA进行登录验证。 不开启 不开启登录保护。 单击“下一步”。 在
开启登录保护后,IAM用户登录时,除了在登录页面输入用户名和密码外(第一次身份验证),还需要在登录验证页面输入验证码(第二次身份验证),该功能是一种安全实践,建议开启登录保护,多次身份认证可以提高账号安全性。 您可以选择通过手机、邮箱、虚拟MFA进行登录验证。 不开启 不开启登录保护。 单击“下一步”。 在
务器配置步骤参考配置DHCP服务器。 假设以华为FW设备作为DHCP服务器,且已经被华为乾坤云平台纳管,DHCP服务器配置步骤参考配置DHCP服务器。 结果验证 设备上电被华为乾坤云平台纳管,用户可登录华为乾坤工作台,检查交换机状态。如果状态为“正常”,说明交换机已成功注册上线。