搜索_华为云

执行SFT全参微调训练任务 - AI开发平台ModelArts

/home/ma-user/ws/llm_train/AscendSpeed 下执行启动脚本。启动训练脚本可使用以下两种启动命令，二选一即可，其中区别如下：传递参数形式：将主节点IP地址、节点个数、节点RANK的参数传递至运行的脚本中执行。多机执行命令为：sh scripts/llama2/0_pl_sft_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908）
执行SFT全参微调训练任务 - AI开发平台ModelArts

/home/ma-user/ws/llm_train/AscendSpeed 下执行启动脚本。启动训练脚本可使用以下两种启动命令，二选一即可，其中区别如下：传递参数形式：将主节点IP地址、节点个数、节点RANK的参数传递至运行的脚本中执行。多机执行命令为：sh scripts/llama2/0_pl_sft_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910）
执行SFT全参微调训练任务 - AI开发平台ModelArts

/home/ma-user/ws/llm_train/AscendSpeed 下执行启动脚本。启动训练脚本可使用以下两种启动命令，二选一即可，其中区别如下：传递参数形式：将主节点IP地址、节点个数、节点RANK的参数传递至运行的脚本中执行。多机执行命令为：sh scripts/llama2/0_pl_sft_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）
准备图像分类数据 - AI开发平台ModelArts

准备图像分类数据使用ModelArts自动学习构建模型时，您需要将数据上传至对象存储服务（OBS）中。OBS桶需要与ModelArts在同一区域。数据集要求保证图片质量：不能有损坏的图片，目前支持的格式包括jpg、jpeg、bmp、png。不要把明显不同的多个任务数据放在同一个数据集内。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
配置Lite Cluster存储 - AI开发平台ModelArts

常会先将数据拉取到本地cache，然后再进行训练任务。静态挂载动态挂载 SFS Turbo 适用于海量小文件业务场景。提供posix协议的文件系统；需要和资源池在同一个VPC下或VPC互通；价格较高。静态挂载动态挂载：不支持 SFS 适用于多读多写场景的持久化存储。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
自动学习的每个项目对数据有哪些要求？ - AI开发平台ModelArts

自动学习的每个项目对数据有哪些要求？图像分类对数据集的要求文件名规范：不能有+、空格、制表符。保证图片质量：不能有损坏的图片，目前支持的格式包括jpg、jpeg、bmp、png。不要把明显不同的多个任务数据放在同一个数据集内。每一类数据尽量多，尽量均衡。期望获得良好效果

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 准备数据
从OBS目录导入数据到数据集 - AI开发平台ModelArts

确保数据存储的OBS桶与ModelArts在同一区域，并确保用户具有OBS桶的操作权限。文件型数据从OBS目录导入操作不同类型的数据集，导入操作界面的示意图存在区别，请参考界面信息了解当前类型数据集的示意图。当前操作指导以图像分类的数据集为例。登录ModelArts管理控制台，在左侧菜单栏中选择“资产管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
执行预训练任务 - AI开发平台ModelArts

n/AscendSpeed 下执行启动脚本。xxx-Ascend请根据实际目录替换。启动训练脚本可使用以下两种启动命令，二选一即可，其中区别如下：传递参数形式：将主节点IP地址、节点个数、节点RANK的参数传递至运行的脚本中执行。 # 多机执行命令为：sh scripts/l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910）
非分离部署推理服务 - AI开发平台ModelArts

INFO: Application startup complete. INFO: Uvicorn running on http://0.0.0.0:8080 (Press CTRL+C to quit) Step7 推理请求使用命令测试推理服务是否正常启动。服务启动命令中的参数设置请参见表1。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
执行预训练任务 - AI开发平台ModelArts

n/AscendSpeed 下执行启动脚本。xxx-Ascend请根据实际目录替换。启动训练脚本可使用以下两种启动命令，二选一即可，其中区别如下：传递参数形式：将主节点IP地址、节点个数、节点RANK的参数传递至运行的脚本中执行。 # 多机执行命令为：sh scripts/l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908）
执行预训练任务 - AI开发平台ModelArts

n/AscendSpeed 下执行启动脚本。xxx-Ascend请根据实际目录替换。启动训练脚本可使用以下两种启动命令，二选一即可，其中区别如下：传递参数形式：将主节点IP地址、节点个数、节点RANK的参数传递至运行的脚本中执行。 # 多机执行命令为：sh scripts/l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）
执行LoRA微调训练任务 - AI开发平台ModelArts

/home/ma-user/ws/llm_train/AscendSpeed 下执行启动脚本。启动训练脚本可使用以下两种启动命令，二选一即可，其中区别如下：传递参数形式：将主节点IP地址、节点个数、节点RANK的参数传递至运行的脚本中执行。多机执行命令为：sh scripts/llama2/0_pl_lora_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）
执行LoRA微调训练任务 - AI开发平台ModelArts

/home/ma-user/ws/llm_train/AscendSpeed 下执行启动脚本。启动训练脚本可使用以下两种启动命令，二选一即可，其中区别如下：传递参数形式：将主节点IP地址、节点个数、节点RANK的参数传递至运行的脚本中执行。多机执行命令为：sh scripts/llama2/0_pl_lora_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910）
执行LoRA微调训练任务 - AI开发平台ModelArts

/home/ma-user/ws/llm_train/AscendSpeed 下执行启动脚本。启动训练脚本可使用以下两种启动命令，二选一即可，其中区别如下：传递参数形式：将主节点IP地址、节点个数、节点RANK的参数传递至运行的脚本中执行。多机执行命令为：sh scripts/llama2/0_pl_lora_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908）
推理精度测试 - AI开发平台ModelArts

eval_dataset：评测使用的评测集（枚举值），目前仅支持mmlu、ceval。 service_url：服务接口地址，若服务部署在notebook中，该地址为"http://127.0.0.1:${port}/v1/completions"；若服务部署在生产环境中，该地址由API接口公网地址与"/v1/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
非分离部署推理服务 - AI开发平台ModelArts

INFO: Application startup complete. INFO: Uvicorn running on http://0.0.0.0:8080 (Press CTRL+C to quit) 步骤七推理请求使用命令测试推理服务是否正常启动。服务启动命令中的参数设置请参见表1。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

日志文件，则对应的父级目录也不会上传。因此，PyTorch NPU的plog日志是按worker存储的，而不是按rank id存储的（这是区别于MindSpore的）。目前，PyTorch NPU并不依赖rank table file。 #!/bin/bash # MA preset

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
出现ModelArts.6333错误，如何处理？ - AI开发平台ModelArts

出现ModelArts.6333错误，如何处理？问题现象在使用Notebook过程中，界面出现“ModelArts.6333”报错信息。原因分析可能由于实例过负载引起故障，Notebook正在自动恢复中，请刷新页面并等待几分钟。常见原因是内存占用满。处理方法当出现此错

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
部署推理服务 - AI开发平台ModelArts

方式一：通过OpenAI服务API接口启动服务使用以下推理测试命令。${model_path}请替换为实际使用的模型名称。 curl -X POST http://localhost:8080/v1/chat/completions \ -H "Content-Type: application/json"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

启动服务命令如下。 python main.py --port 8183 --listen 172.17.0.7 --force-fp16 使用http://{宿主机ip}:8183 可以访问前端页面，如下运行文生图。图1 访问前端页面根据上面checkpoint的箭头，对新的npu

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理

总条数： 328

上一页
1
...
8
9
10
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行SFT全参微调训练任务 - AI开发平台ModelArts

执行SFT全参微调训练任务 - AI开发平台ModelArts

执行SFT全参微调训练任务 - AI开发平台ModelArts

准备图像分类数据 - AI开发平台ModelArts

配置Lite Cluster存储 - AI开发平台ModelArts

自动学习的每个项目对数据有哪些要求？ - AI开发平台ModelArts

从OBS目录导入数据到数据集 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

执行预训练任务 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

出现ModelArts.6333错误，如何处理？ - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线