检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
训练脚本说明 Yaml配置文件参数配置说明 模型NPU卡数、梯度累积值取值表 各个模型训练前文件替换 NPU_Flash_Attn融合算子约束 BF16和FP16说明 录制Profiling 父主题: 主流开源大模型基于DevServer适配LlamaFactory PyTorch
预训练任务 步骤一 上传训练权重文件和数据集 如果在准备代码和数据阶段已经上传权重文件和数据集到容器中,可以忽略此步骤。 如果未上传训练权重文件和数据集到容器中,具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。
查看日志和性能 查看日志 若查看启动作业日志信息,可通过以下命令打印正在启动的日志信息。其中${pod_name}为pod信息中的NAME,例如vcjob-main-0。 kubectl logs -f ${pod_name} 训练过程中,训练日志会在最后的Rank节点打印。 图1
准备资源 创建专属资源池 本文档中的模型运行环境是ModelArts Standard,用户需要购买专属资源池,具体步骤请参考创建资源池。 资源规格要求: 计算规格:用户可参考表1。 硬盘空间:至少200GB。 昇腾资源规格: Ascend: 1*ascend-snt9b表示昇腾单卡。
准备镜像 镜像方案说明 ECS获取和上传基础镜像 使用基础镜像 ECS中构建新镜像 父主题: 准备工作
LoRA微调训练 前提条件 已上传训练代码、训练权重文件和数据集到SFS Turbo中。 Step1 修改训练超参配置 以llama2-13b LORA微调为例,执行脚本0_pl_lora_13b.sh 。 修改模型训练脚本中的超参配置,必须修改的参数如表1所示。其他超参均有默认值,可以参考表1按照实际需求修改。
查看日志和性能 单击作业详情页面,则可查看训练过程中的详细信息。 图1 查看训练作业 在作业详情页的日志页签,查看最后一个节点的日志,其包含“elapsed time per iteration (ms)”数据,可换算为tokens/s/p的性能数据。 吞吐量(tokens/s/p):global
预训练任务 步骤一 上传训练权重文件和数据集 如果在准备代码和数据阶段已经上传权重文件和数据集到容器中,可以忽略此步骤。 如果未上传训练权重文件和数据集到容器中,具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。
LoRA微调训练 步骤一 上传训练权重文件和数据集 如果在准备代码和数据阶段已经上传权重文件和数据集到容器中,可以忽略此步骤。 如果未上传训练权重文件和数据集到容器中,具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。
准备镜像 镜像方案说明 ECS获取和上传基础镜像 使用基础镜像 ECS中构建新镜像 父主题: 准备工作
可以对华为云外的站点提供服务吗? 可以为计划将业务迁移到华为云的企业提供服务。 父主题: 关于服务咨询
如何使用状态管理插件 状态管理插件,可添加页面变量(state变量)和添加全局变量(stores变量),供页面及应用使用。 添加页面变量 页面状态下的变量仅适用于当前页面。 登录流程引擎。 在左侧导航栏中,选择“流程编排服务 > 流程元模板”,进入“流程元模板”页面。 在流程元模
流程编辑页面概述 什么是流程编辑 流程编辑页面是一种将流程工具拖拽到在线编辑区进行低代码甚至无代码配置,即可快速完成业务流程设计的前端页面。通过在流程编辑页面绘制业务流程,企业可以更清晰地理解流程的各个步骤和关系,方便与团队成员/相关方进行沟通、交流。 初识流程编辑页面 创建流程
TypeError("Cannot index by location index with a non-integer key") 问题现象 在judge日志中出现TypeError("Cannot index by location index with a non-integer
PSQLException: ERROR: invalid input syntax for type numeric 问题现象 judge历史的原始详情中出现PSQLException: ERROR: invalid input syntax for type numeric报错。
使用自动分组智能标注作业 为了提升智能标注算法精度,可以均衡标注多个类别,有助于提升智能标注算法精度。ModelArts内置了分组算法,您可以针对您选中的数据,执行自动分组,提升您的数据标注效率。 自动分组可以理解为数据标注的预处理,先使用聚类算法对未标注图片进行聚类,再根据聚类
ModelArts预置镜像更新说明 本章节提供了ModelArts预置镜像的变更说明 ,比如依赖包的变化,方便用户感知镜像能力的差异,减少镜像使用问题。 统一镜像更新说明 表1 统一镜像更新说明 镜像名称 更新时间 更新说明 mindspore_2.3.0-cann_8.0.rc1-py_3
参见对接ROMA Connect调用服务的API。 场景二:通过配置数据接入,可集成ROMA Connect的消息数据,将消息上报并转化为平台内部的事件。配置数据接入的相关操作,请参见通过数据接入将消息类数据接入AstroZero。 设置ROMA Connect信息 在Astro
不同的实名认证方式所需的材料都有哪些? 个人认证: 认证方式 认证时长 所需认证材料与方式 银行卡认证 即时 银行卡资料 银行卡预留手机号 使用银行卡预留的手机号接收短信验证码进行实名认证 人脸识别认证 即时 大陆居民身份证信息 使用手机扫脸进行实名认证。 个人证件认证 0-3个工作日 非大陆居民使用的身份证明
开发说明 平台侧的开发 主要包括Profile的开发和编解码插件的开发。编解码插件的开发仅针对上报数据为二进制码流格式的设备,对于上报数据为JSON格式的设备不需要开发编解码插件。 设备侧的开发 主要为设备与物联网平台的集成对接开发,包括设备接入物联网平台、业务数据上报和对平台下发控制命令的处理。