搜索_华为云

训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练tokenizer文件说明断点续训和故障快恢说明父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误 mc2融合算子报错父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）场景介绍准备工作 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： MLLM多模态模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像镜像方案说明 ECS获取基础镜像 ECS中构建新镜像 ECS中上传新镜像父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误联网下载SimSun.ttf时可能会遇到网络问题在运行finetune_ds.sh 时遇到报错父主题： Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）场景介绍准备工作 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： MLLM多模态模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置表1 不同模型推荐的参数与NPU卡数设置模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具 (Deepspeed) 规格与节点数 Qwen-VL Qwen-VL 7B full 2048 gr

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
DeepSeek系列模型推理 - AI开发平台ModelArts

DeepSeek系列模型推理 DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导基于MaaS DeepSeek API和Dify快速构建网站智能客服基于MaaS DeepSeek API和Cherry Studio快速构建个人AI智能助手

 帮助中心 > AI开发平台ModelArts > 最佳实践
模型管理 - AI开发平台ModelArts
模型管理 - AI开发平台ModelArts

模型管理模型调试导入模型查询模型列表查询模型对象列表查询模型详情删除模型

 帮助中心 > AI开发平台ModelArts > SDK参考
导出任务管理 - AI开发平台ModelArts

导出任务管理查询导出任务列表创建导出任务查询导出任务状态父主题：数据管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理
Manifest管理 - AI开发平台ModelArts

Manifest管理 Manifest管理概述解析Manifest文件创建和保存Manifest文件解析Pascal VOC文件创建和保存Pascal VOC文件父主题：数据管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理
训练作业 - AI开发平台ModelArts
训练作业 - AI开发平台ModelArts

训练作业创建训练作业训练作业调测查询训练作业列表查询训练作业详情更新训练作业描述删除训练作业终止训练作业查询训练日志查询训练作业的运行指标父主题：训练管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理
训练作业调测 - AI开发平台ModelArts

训练作业调测使用SDK调测单机训练作业使用SDK调测多机分布式训练作业父主题：训练作业

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

对于OBS连接不稳定的现象，通过增加代码来解决。您可以在代码最前面增加如下代码，让TensorFlow对ckpt和summary的读取和写入可以通过本地缓存的方式中转解决： import moxing.tensorflow as mox mox.cache() 父主题： OBS操作相关故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

ModelArts 6.3.912 版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明 AscendCloud-6.3.912代码包中AscendCloud-LLM代码包结构如下： |——AscendCloud-LLM

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

是否必选参数说明 YAML_FILE String 否 DLI Spark作业的配置文件本地路径，如果不传则表示配置文件为空。 --file String 是程序运行入口文件，支持本地文件路径、OBS路径或者用户已上传到DLI资源管理系统的类型为jar或pyFile的程序包名。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
SDXL基于Lite Server适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

LoRA训练是指在已经训练好的SDXL模型基础上，使用新的数据集进行LoRA微调以优化模型性能的过程。本文档主要介绍如何利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，完成SDXL的LoRA微调训练。资源规格要求推荐使用“西南-贵阳一”Region上的Lite Server资源和Ascend

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
在Windows上安装配置Grafana - AI开发平台ModelArts

双击安装包，按照指示流程安装完成即可。在Windows的“服务”中，找到Grafana，将其开启，如果已经开启，则直接进入4。登录Grafana。 Grafana默认在本地的3000端口启动，打开链接http://localhost:3000，出现Grafana的登录界面。首次登录用户名和密码为admin，登录成功后请根据提示修改密码。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
AIGC工具tailor使用指导 - AI开发平台ModelArts

benchmark run_benchmark.sh 是运行benchmark的脚本，可本地直接运行。 run_benchmark_accuracy.sh 是 benchmark运行精度的脚本，可本地直接运行。 performance.txt 是 benchmark性能测试结果。 accuracy

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

obs_path=base_bucket_path + 'train/') 参数解释： code_dir：必选参数，训练脚本所在的目录。在本地调试的情况下，必须是notebook目录，不能是OBS目录。 boot_file：必选参数，训练启动文件，在code_dir目录下。 ob

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测

总条数： 1257

上一页
1
...
36
37
38
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练脚本说明 - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

DeepSeek系列模型推理 - AI开发平台ModelArts

模型管理 - AI开发平台ModelArts

导出任务管理 - AI开发平台ModelArts

Manifest管理 - AI开发平台ModelArts

训练作业 - AI开发平台ModelArts

训练作业调测 - AI开发平台ModelArts

保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

SDXL基于Lite Server适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

在Windows上安装配置Grafana - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线