搜索_华为云

SDXL基于DevServer适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

1。 docker build -t sdxl-train:0.0.1 . Step4 启动镜像启动容器镜像。启动前可以根据实际需要增加修改参数。 docker run -itd --name sdxl-train -v /sys/fs/cgroup:/sys/fs/cgroup:ro

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
配置仪表盘查看指标数据 - AI开发平台ModelArts

在New Dashboards界面，单击“Add a new panel”。在New dashboard /Edit Panel界面，填写如下参数。 Data source：已配置Grafana数据源； Metric：指标名称，可参考表1、表2、表3获取想要查询的指标； Labels：填写过滤该指标的标签，请参考表4。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
准备Notebook - AI开发平台ModelArts

scripts/install.sh安装依赖包，因此Notebook保存镜像为可选操作。图3 安装依赖包图4 保存镜像图5 填写保存镜像相关参数父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

在ModelArts上创建训练作业登录ModelArts管理控制台，在左侧导航栏中选择“训练管理 > 训练作业”，默认进入“训练作业”列表。在“创建训练作业”页面，填写相关参数信息，然后单击“提交”。创建方式：选择“自定义算法” 启动方式：选择“自定义” 镜像地址：“swr.cn-north-4

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
推理场景介绍 - AI开发平台ModelArts

说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。支持的模型列表和权重文件本方案支持vLLM的v0.5.0版本。不同vLLM版本支持的模型列表有差异，具体如表3所示。表3 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

-t Open-Sora-Plan1.0:1.0 . Step4 启动镜像启动容器镜像，推理只需要启动单卡，启动前可以根据实际需要增加修改参数。 docker run -itd --name ${container_name} -v /sys/fs/cgroup:/sys/fs/cgroup:ro

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

MindInsight界面（2） Step4 查看训练看板中的可视化数据训练看板是MindInsight的可视化组件的重要组成部分，而训练看板的标签包含：标量可视化、参数分布图可视化、计算图可视化、数据图可视化、图像可视化和张量可视化等。更多功能介绍请参见MindSpore官网资料：查看训练看板中可视的数据。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
Notebook中构建新镜像 - AI开发平台ModelArts

像，无需每次启动训练作业时再次下载代码包以及安装依赖包，可节约训练作业启动时间。图5 安装依赖包图6 保存镜像图7 填写保存镜像相关参数父主题：准备镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

1。 docker build -t sdxl-train:0.0.1 . Step4 启动镜像启动容器镜像。启动前可以根据实际需要增加修改参数。 docker run -itd --name sdxl-train -v /sys/fs/cgroup:/sys/fs/cgroup:ro

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
NPU日志收集上传 - AI开发平台ModelArts

Id），SK（Secret Access Key）。图1 credential.csv文件内容 AK/SK生成步骤：登录管理控制台。单击右上角的用户名，在下拉列表中单击“我的凭证”。单击“访问密钥”。单击“新增访问密钥”。下载密钥，并妥善保管。准备租户名ID和IAM用户名ID，用于OBS桶配置。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

rain_13b.sh 的脚本，开始训练。在训练中，程序会自动执行对数据集预处理、权重转换、执行训练等操作，具体可通过训练启动脚本说明和参数配置、训练的数据集预处理说明、训练的权重转换说明了解其中的操作。训练完成后在SFS Turbo中保存训练的模型结果。（多机情况下，只有在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作
在ModelArts Standard上运行GPU多机多卡训练任务 - AI开发平台ModelArts

钥授权的用户，建议清空授权，然后使用委托进行授权。在左侧导航栏中选择“模型训练 > 训练作业”，默认进入“训练作业”列表。在“创建训练作业”页面，填写相关参数信息，然后单击“提交”。创建方式：选择“自定义算法”。启动方式：选择“自定义”。镜像：选择上传的自定义镜像。启动命令：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

的“/etc/prometheus”目录，并且通过--config.file=/etc/prometheus/prometheus.yml参数指定了“/bin/prometheus”使用该配置文件。 apiVersion: v1 kind: "Service" metadata:

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

rain_13b.sh 的脚本，开始训练。在训练中，程序会自动执行对数据集预处理、权重转换、执行训练等操作，具体可通过训练启动脚本说明和参数配置、训练的数据集预处理说明、训练的权重转换说明了解其中的操作。训练完成后在SFS Turbo中保存训练的模型结果。（多机情况下，只有在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

开发环境中不同Notebook规格资源“/cache”目录的大小在Notebook中，如何使用昇腾多卡进行调试？更多 AI应用管理导入模型时，模型配置文件中的安装包依赖参数如何编写？使用自定义镜像创建在线服务，如何修改默认端口？更多技术专题技术、观点、课程专题呈现 ModelArts 构建精准声音模型

 帮助中心 > AI开发平台ModelArts > 成长地图
配置多分支节点数据 - AI开发平台ModelArts

) ), # 训练资源规格信息 depend_steps=[condition_step] ) # 定义模型名称参数 model_name = wf.Placeholder(name="placeholder_name", placeholder_type=wf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

rain_13b.sh 的脚本，开始训练。在训练中，程序会自动执行对数据集预处理、权重转换、执行训练等操作，具体可通过训练启动脚本说明和参数配置、训练的数据集预处理说明、训练的权重转换说明了解其中的操作。训练完成后在SFS Turbo中保存训练的模型结果。（多机情况下，只有在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
InternVL2基于DevServer适配PyTorch NPU训练微调指导（6.3.908） - AI开发平台ModelArts

}获取请参见表1。 docker pull {image_url} Step3 启动容器镜像启动容器镜像，启动前可以根据实际需要增加修改参数。 docker run -itd --net=host \ --device=/dev/davinci0 \ --device=/dev/davinci1

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
配置Workflow的输入输出目录 - AI开发平台ModelArts

路径为"/root/"，则系统自动创建相对目录，最后得到的路径为"/root/执行ID/directory_path" 通过join方法的参数实现同一个Storage的不同用法 import modelarts.workflow as wf # 构建一个Storage对象, 并

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
线下容器镜像构建及调试 - AI开发平台ModelArts

可以直接把SFS的目录直接挂载到调试节点的"/mnt/sfs_turbo"目录，或者保证对应目录的内容和SFS盘匹配。调试时建议使用接近的方式，即：启动容器实例时使用"-v"参数来指定挂载某个宿主机目录到容器环境。 docker run -ti -d -v /mnt/sfs_turbo:/sfs my_deeplearning_image:v1

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡

总条数： 1082

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SDXL基于DevServer适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

配置仪表盘查看指标数据 - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

Notebook中构建新镜像 - AI开发平台ModelArts

SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

NPU日志收集上传 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练任务 - AI开发平台ModelArts

使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

配置多分支节点数据 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

InternVL2基于DevServer适配PyTorch NPU训练微调指导（6.3.908） - AI开发平台ModelArts

配置Workflow的输入输出目录 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线