搜索_华为云

训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910）
配置ModelArts Standard访问授权 - AI开发平台ModelArts

配置ModelArts Standard访问授权快速配置ModelArts委托授权创建IAM用户并授权使用ModelArts 父主题： ModelArts Standard准备工作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
ModelArts Standard资源管理 - AI开发平台ModelArts

ModelArts Standard资源管理 Standard资源池功能介绍创建Standard专属资源池管理Standard专属资源池

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
使用ModelArts Standard部署模型并推理预测 - AI开发平台ModelArts

使用ModelArts Standard部署模型并推理预测推理部署使用场景创建模型创建模型规范参考将模型部署为实时推理作业将模型部署为批量推理服务管理ModelArts模型管理同步在线服务管理批量推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）场景介绍准备工作在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化 eagle 投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化 Eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备镜像父主题：主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备资源准备权重准备代码准备镜像准备Notebook 父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备数据准备镜像父主题：主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908）
SFT全参微调训练任务 - AI开发平台ModelArts

sh scripts/llama2/0_pl_sft_13b.sh <MASTER_ADDR=localhost> <NNODES=1> <NODE_RANK=0> sh scripts/llama2/0_pl_sft_13b.sh localhost 1 0 训练完成后，请参考查看日志和性能章节查看

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
（可选）工作空间配置 - AI开发平台ModelArts

如果您开通了企业项目管理服务的权限，可以在创建工作空间的时候绑定企业项目ID，并在企业项目下添加用户组，为不同的用户组设置细粒度权限供组里的用户使用。如果您未开通企业项目管理服务的权限，也可以在ModelArts创建自己独立的工作空间，但是无法使用跟企业项目相关的功能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
为什么资源充足还是在排队？ - AI开发平台ModelArts

图1 总览单击进入专属资源池详情页面，查看作业列表。观察队头是否有其他作业在排队，如果已有作业在排队，则新建的作业需要继续等待。图2 作业排队列表如果通过排查计算，发现资源确实足够，则考虑可能由于资源碎片化导致的。

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、训练任务、性能查看。微调训练 SFT全参微调介绍如何进行SFT全参微调、超参配置、训练任务、性能查看。 LoRA微调训练介绍如何进行LoRA微调、超参配置、训练任务、性能查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.911）
删除资源池 - AI开发平台ModelArts

可选值如下： 0：代表不受限 1：转包周期受限 2：规格变更受限 4：服务受限 8：冻结 16：公安冻结（不可退订）另外状态是可以叠加的，比如9代表转包周期受限+冻结状态。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、训练任务、性能查看。微调训练 SFT全参微调介绍如何进行SFT全参微调、超参配置、训练任务、性能查看。 LoRA微调训练介绍如何进行LoRA微调、超参配置、训练任务、性能查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911）
发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

您可以查看数据集的基本信息，并在左侧查看版本演进信息及其发布时间。设置当前版本登录ModelArts管理控制台，在左侧菜单栏中选择“资产管理>数据集”，进入“数据集”管理页面。在数据集列表中，单击操作列的“更多 > 版本管理”，进入数据集“版本管理”页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
自动学习声音分类预测报错ERROR:input key sound is not in model - AI开发平台ModelArts

自动学习声音分类预测报错ERROR:input key sound is not in model 根据在线服务预测报错日志ERROR：input key sound is not in model inputs可知，预测的音频文件是空。预测的音频文件太小，换大的音频文件预测。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
训练中的权重转换说明 - AI开发平台ModelArts

输出转换后权重文件保存路径：权重转换完成后，在 /home/ma-user/ws/saved_dir_for_output/llama2-13b/saved_models/pretrain_hf/ 目录下查看转换后的权重文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
使用Notebook进行代码调试 - AI开发平台ModelArts

挂载成功后，可以在Notebook实例详情页查看到挂载结果。代码调试。打开Notebook，打开Terminal，进入步骤7中挂载的目录。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

如果上述方法还出现了错误，可以去notebook里面调试打印CUDA_VISIBLE_DEVICES变量，或者用以下代码测试，查看结果是否返回的是True。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题

总条数： 1978

上一页
1
...
72
73
74
...
99
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练脚本说明 - AI开发平台ModelArts

配置ModelArts Standard访问授权 - AI开发平台ModelArts

ModelArts Standard资源管理 - AI开发平台ModelArts

使用ModelArts Standard部署模型并推理预测 - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

（可选）工作空间配置 - AI开发平台ModelArts

为什么资源充足还是在排队？ - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

自动学习声音分类预测报错ERROR:input key sound is not in model - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

使用Notebook进行代码调试 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线