搜索_华为云

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

0-147.5.1.6.h934.eulerosv2r9.x86_64 下安装的nvidia-driver-515，由于执行了yum update并reboot服务器，发现再次执行nvidia命令时报错： [root@Server-ddff ~]# nvidia-smi NVIDIA-SMI

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
使用MaaS调优模型 - AI开发平台ModelArts

全参微调：直接在模型上训练，影响模型全量参数的微调训练，效果较好，收敛速度较慢，训练时间较长。 LoRA微调：冻结原模型，通过往模型中加入额外的网络层，并只训练这些新增的网络层参数，效果接近或略差于全参训练，收敛速度快，训练时间短。调优后的模型名称设置调优后产生的新模型的名称。支持1~6

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
查询数据集的团队标注任务列表 - AI开发平台ModelArts

参数是否必选参数类型描述 offset 否 Integer 分页列表的起始页，默认为0。 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1,1000]，默认为1000。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练的权重转换说明 - AI开发平台ModelArts

g Face格式权重。若用户需要自动转换，则在运行脚本，例如0_pl_pretrain_13b.sh中，添加变量CONVERT_MG2HF并赋值TRUE。若用户后续不需要自动转换，则在运行脚本中必须删除CONVERT_MG2HF变量。 Megatron转HuggingFace脚本具体参数如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

表2 操作任务流程说明阶段任务说明准备工作准备环境本教程案例是基于ModelArts Lite DevServer运行的，需要购买并开通DevServer资源。准备代码准备AscendSpeed训练代码、分词器Tokenizer和推理代码。准备数据准备训练数据，可

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

使用root用户以SSH的方式登录DevServer。将AscendSpeed代码包AscendCloud-3rdLLM-xxx-xxx.zip上传到${workdir}目录下并解压缩，如：/home/ma-user/ws目录下，以下都以/home/ma-user/ws为例。 unzip AscendCloud-3rdLLM-xxx-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
创建数据处理任务版本 - AI开发平台ModelArts

object 数据处理任务的工作目录。 workspace_id 否 String 工作空间ID。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。表3 ProcessorDataSource 参数是否必选参数类型描述 name 否 String 数据集的名称。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
删除网络资源 - AI开发平台ModelArts

modelarts/workspace.id String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。表5 NetworkMetadataAnnotations 参数参数类型描述 os.modelarts/description

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
发布本地AI应用到AI Gallery - AI开发平台ModelArts

自定义一个易于分辨的AI应用中文名称。字符长度在1到30之间。许可证否选择AI应用遵循的许可证。计算规格选择是按需选择计算规格。单击“选择”，在弹窗中选择资源规格并设置运行时长控制，单击“确定”。在“所在区”选择计算规格所在的区域。默认显示全部区域的计算规格。选择计算规格不可用的资源会置灰。右侧“配

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
训练的数据集预处理说明 - AI开发平台ModelArts

PretrainedFromHF 。 SEQ_LEN 4096 要处理的最大seq length。脚本会检测超出SEQ_LEN长度的数据，并打印log。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
训练的权重转换说明 - AI开发平台ModelArts

Face格式权重。如果用户需要自动转换，则在运行脚本，例如0_pl_pretrain_13b.sh中，添加变量CONVERT_MG2HF并赋值TRUE。如果用户后续不需要自动转换，则在运行脚本中必须删除CONVERT_MG2HF变量。 Megatron转HuggingFace脚本具体参数如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 训练脚本说明
训练的权重转换说明 - AI开发平台ModelArts

g Face格式权重。若用户需要自动转换，则在运行脚本，例如0_pl_pretrain_13b.sh中，添加变量CONVERT_MG2HF并赋值TRUE。若用户后续不需要自动转换，则在运行脚本中必须删除CONVERT_MG2HF变量。 Megatron转HuggingFace脚本具体参数如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

使用root用户以SSH的方式登录DevServer。将AscendSpeed代码包AscendCloud-3rdLLM-xxx.zip上传到${workdir}目录下并解压缩，如：/home/ma-user/ws目录下，以下都以/home/ma-user/ws为例。 unzip AscendCloud-3rdLLM-*

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
访问在线服务（AK/SK认证） - AI开发平台ModelArts

credential.csv文件内容 AK/SK生成步骤：注册并登录管理控制台。单击右上角的用户名，在下拉列表中单击“我的凭证”。单击“访问密钥”。单击“新增访问密钥”，进入“身份验证”页面。根据提示完成身份验证，下载密钥，并妥善保管。获取在线服务信息在调用接口时，需获取在线

 帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 部署AI应用（部署上线） > 部署AI应用（在线服务） > 访问在线服务 > 认证方式
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

查询用户镜像组列表查询用户镜像信息概览，以镜像名称作为聚合的信息。查询镜像详情查询镜像详情。删除镜像删除镜像对象，对于个人私有镜像可以通过参数一并删除SWR镜像内容。训练管理接口表6 算法管理接口 API 说明创建算法创建一个算法。查询算法列表查询算法列表。查询算法详情根据算法ID查询指定算法。

帮助中心 > AI开发平台ModelArts > API参考
训练的数据集预处理说明 - AI开发平台ModelArts

PretrainedFromHF 。 SEQ_LEN 4096 要处理的最大seq length。脚本会检测超出SEQ_LEN长度的数据，并打印log。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

PretrainedFromHF 。 SEQ_LEN 4096 要处理的最大seq length。脚本会检测超出SEQ_LEN长度的数据，并打印log。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

在ModelArts官方提供的基础镜像上，构建一个用于ModelArts Standard推理部署的镜像。在模型软件包和依赖包的同层目录下，创建并编辑Dockerfile。 vim Dockerfile Dockerfile内容如下： FROM swr.cn-southwest-2.myhuaweicloud

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
开发第一条Workflow - AI开发平台ModelArts

>Notebook”。单击“创建”，进入创建页面，选择默认参数后，单击“立即创建”，确认信息无误后单击“提交”。任务提交成功后单击“立即返回”跳转至Notebook列表页。Notebook实例更多参数介绍请参见创建Notebook实例章节。查看2中创建好的实例，确保其状态为“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
断点续训练 - AI开发平台ModelArts

lm_train/AscendSpeed/ 修改断点续训练参数。断点续训前，需要在原有训练参数配置表1中新加“MODEL_PATH”参数，并修改“TRAIN_ITERS”参数和“RUN_TYPE”参数。表1 断点续训练修改参数参数参考值参数说明 MODEL_PATH /h

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练

总条数： 884

上一页
1
...
40
41
42
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

查询数据集的团队标注任务列表 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

创建数据处理任务版本 - AI开发平台ModelArts

删除网络资源 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

访问在线服务（AK/SK认证） - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

开发第一条Workflow - AI开发平台ModelArts

断点续训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线