搜索_华为云

执行LoRA微调训练任务 - AI开发平台ModelArts

必须修改。加载Hugging Face权重（可与tokenizer相同文件夹）时，对应的存放地址。请根据实际规划修改。 TOKENIZER_PATH /home/ma-user/ws/tokenizers/llama2-13B 该参数为tokenizer文件的存放地址。默认与ORIGINAL_HF_W

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911）
创建导入任务 - AI开发平台ModelArts

1：默认值，标签和文本在一个文件内，以分隔符分离。文本与标签，标签与标签之间的分隔符可通过text_sample_separator和text_label_separator指定。 text_label_separator 否 String 标签与标签之间的分隔符，默认为逗号分隔，分隔符需转

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
推理业务迁移评估表 - AI开发平台ModelArts

- Backbone类型 ResNet/DarkNet/Transformer等。例如： 5个模型使用ResNet Backbone，应用与监控。 3个模型使用Transformer，应用于自然语言处理xxx。使用stable-diffusion的典型模型：TextEncode

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
推理性能测试 - AI开发平台ModelArts

--port：服务端口，和推理服务端口8080。 --url：如果以vllm接口方式启动服务，API接口公网地址与"/generate"拼接而成；如果以openai接口方式启动服务，API接口公网地址与"/v1/completions"拼接而成。部署成功后的在线服务详情页中可查看API接口公网地址。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

--port：服务端口，和推理服务端口8080。 --url：如果以vllm接口方式启动服务，API接口公网地址与"/generate"拼接而成；如果以openai接口方式启动服务，API接口公网地址与"/v1/completions"拼接而成。部署成功后的在线服务详情页中可查看API接口公网地址。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
Llama 3.2-Vision基于DevServer适配Pytorch NPU训练微调指导（6.3.911） - AI开发平台ModelArts

loss结果 sft全参微调NPU训练结果loss收敛且趋势与GPU训练loss一致图3 sft全参微调单机loss曲线对比结果图4 sft全参微调双机loss曲线对比结果 lora微调NPU训练结果loss收敛且趋势与GPU训练loss一致图5 lora微调双机loss曲线对比结果

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
SFT全参微调训练任务 - AI开发平台ModelArts

/home/ma-user/ws/llm_train/AscendSpeed/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B和Qwen系列模型，还需要手动修改toke

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
精度问题诊断 - AI开发平台ModelArts

Lite模型，运行得到的结果再与标杆数据做对比，如果没有差异则说明pipeline的差异不是由当前替换的MindSpore Lite模型引入。如果有差异，则说明当前模型与原始onnx的结果存在差异。依次单独替换onnx模型为对应的MindSpore Lite模型，从而定位出有差异的模型。在模型初始化的代码块已

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
日志提示"Permission denied" - AI开发平台ModelArts

原因分析出现该问题的可能原因如下： [Errno 13]Permission denied: '/xxx/xxxx' 上传数据时文件所属与文件权限未修改，导致训练作业以work用户组访问时没有权限了。在代码目录中的.sh复制到容器之后，需要添加“x”可执行权限。 bash: /bin/ln:

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
查询工作空间详情 - AI开发平台ModelArts

grants 参数参数类型描述 user_id String IAM用户ID。此参数与user_name必填一个。两者都填优先使用user_id。 user_name String IAM用户名称。此参数与user_id必填一个。状态码： 400 表5 响应Body参数参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
LoRA微调训练 - AI开发平台ModelArts

/home/ma-user/ws/llm_train/AscendSpeed/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B和Qwen系列模型，还需要手动修改toke

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
创建自动模型优化的训练作业 - AI开发平台ModelArts

在训练代码中，用户需打印搜索指标参数。已在OBS创建至少1个空的文件夹，用于存储训练输出的内容。由于训练作业运行需消耗资源，确保账户未欠费。确保您使用的OBS目录与ModelArts在同一区域。创建算法进入ModelArts控制台，参考创建算法操作指导，创建自定义算法。镜像应该满足pytorch_1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 自动模型优化（AutoSearch）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

请删除.torchair_cache文件夹，避免由于缓存文件与实际推理不匹配而报错。若要使用eagle投机，配置环境变量，使eagle投机对齐实验室版本实现。目前默认开启此模式，若不开启，目前vllm0.6.0版本与实验室版本权重无法对齐，会导致小模型精度问题。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
SFT全参微调训练任务 - AI开发平台ModelArts

/home/ma-user/ws/llm_train/AscendSpeed/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B、ChatGLMv4-9B和Qwen系列模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

Turbo文件系统支持无缝访问存储在OBS对象存储桶中的对象，用户可以指定SFS Turbo内的目录与OBS对象存储桶进行关联，然后通过创建导入导出任务实现数据同步。通过OBS与SFS Turbo存储联动，可以将最新的训练数据导入到SFS Turbo，然后在训练作业中挂载SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 准备工作
查询数据集导出任务的状态 - AI开发平台ModelArts

需指定op的值。可选值如下： OR：或操作 AND：与操作表6 SearchLabel 参数参数类型描述 name String 标签名。 op String 多个属性之间的操作类型。可选值如下： OR：或操作 AND：与操作 property Map<String,Array<String>>

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
配置Lite Server存储 - AI开发平台ModelArts

场景。在SFS服务控制台上创建文件系统，具体步骤请参考创建SFS Turbo文件系统。同一区域不同可用区之间文件系统与云服务器互通，因此保证SFS Turbo与Server服务器在同一区域即可。当创建文件系统后，您需要使用弹性裸金属服务器来挂载该文件系统，具体步骤请参考挂载N

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

- Backbone类型 ResNet/DarkNet/Transformer等。例如： 5个模型使用ResNet Backbone，应用与监控。 3个模型使用Transformer，应用于自然语言处理xxx。使用stable-diffusion的典型模型：TextEncode

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
预训练任务 - AI开发平台ModelArts

/home/ma-user/ws/llm_train/AscendSpeed/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B和Qwen系列模型，还需要手动修改toke

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
LoRA微调训练 - AI开发平台ModelArts

/home/ma-user/ws/llm_train/AscendSpeed/model/llama2-70B 必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B、ChatGLMv4-9B和Qwen系列模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）

总条数： 859

上一页
1
...
29
30
31
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行LoRA微调训练任务 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

Llama 3.2-Vision基于DevServer适配Pytorch NPU训练微调指导（6.3.911） - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

精度问题诊断 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

查询工作空间详情 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

创建自动模型优化的训练作业 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

查询数据集导出任务的状态 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线