搜索_华为云

准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备资源准备数据准备权重准备代码准备镜像准备Notebook（可选）父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像镜像方案说明 ECS获取和上传基础镜像 ECS中构建新镜像（可选）父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练tokenizer文件说明断点续训和故障快恢说明父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）场景介绍准备工作 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： MLLM多模态模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像镜像方案说明 ECS获取基础镜像 ECS中构建新镜像 ECS中上传新镜像父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误联网下载SimSun.ttf时可能会遇到网络问题在运行finetune_ds.sh 时遇到报错父主题： Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）场景介绍准备工作 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： MLLM多模态模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置表1 不同模型推荐的参数与NPU卡数设置模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具 (Deepspeed) 规格与节点数 Qwen-VL Qwen-VL 7B full 2048 gradient_accumulation_steps

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

服务部署完成且服务处于运行中后，可以往该服务发送推理的请求，请求的内容根据模型的不同可以是文本，图片，语音，视频等内容。当使用调用指南页签中显示的调用地址（华为云APIG网关服务的地址）预测时，对请求体的大小限制是12MB，超过12MB时，请求会被拦截。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
Ascend-vLLM介绍 - AI开发平台ModelArts

算子：使用CANN基础算子和高性能融合算子，同时支持用户自定义算子，持续迭代优化，提高推理效率。模型：结构实现和社区一致，Huggingface模型开箱即用，同时可以快速适配新模型。调用：提供高性能算子下发和图模式两种方案，兼顾性能和灵活性。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
Ascend-vLLM介绍 - AI开发平台ModelArts

算子：使用CANN基础算子和高性能融合算子，同时支持用户自定义算子，持续迭代优化，提高推理效率。模型：结构实现和社区一致，Huggingface模型开箱即用，同时可以快速适配新模型。调用：提供高性能算子下发和图模式两种方案，兼顾性能和灵活性。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901）
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

自动高性能算子生成工具自动高性能算子生成工具AKG（Auto Kernel Generator），可以对深度神经网络模型中的算子进行优化，并提供特定模式下的算子自动融合功能，可提升在昇腾硬件后端上运行模型的性能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
昇腾云服务6.3.910版本说明 - AI开发平台ModelArts

满足BMTrain框架训练性能要求优化PageAttention算子，满足vllm投机推理场景支持CopyBlocks算子，满足vllm框架beam search解码场景支持AdvanceStep算子，满足vllm投机推理场景多个融合算子支持PTA图模式适配，满足AIGC

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

支持单机多卡推理 ATB模式支持w8a16量化，推理性能提升配套CANN8.0.RC1镜像无算子，包名：AscendCloud-OPP Scatter、Gather算子性能提升，满足MoE场景昇腾随机数生成算子与GPU保持一致支持GroupNorm+transpose+BMM融合算子

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
执行训练任务（推荐） - AI开发平台ModelArts

步骤三启动任务 Yi-34B、Qwen1.5系列、GLM4-9B模型执行lora微调策略任务如产生mc2融合算子错误，可参考mc2融合算子报错创建test-benchmark，该目录存放训练生成的权重文件及训练日志可以多次执行， # 任意目录创建 mkdir test-benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
部署推理服务 - AI开发平台ModelArts

Matmul_all_reduce融合算子。使用Matmul_all_reduce融合算子能提升全量推理性能；该算子要求驱动和固件版本为Ascend HDK 24.1.RC1.B011及以上，默认不开启。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
创建ModelArts数据集 - AI开发平台ModelArts

视频：对视频类数据进行处理，支持.mp4格式，支持用户进行视频标注。自由格式：管理的数据可以为任意格式，目前不支持标注，适用于无需标注或开发者自行定义标注的场景。如果您的数据集需存在多种格式数据，或者您的数据格式不符合其他类型数据集时，可选择自由格式的数据集。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
应用场景 - AI开发平台ModelArts
应用场景 - AI开发平台ModelArts

AIGC 提供AIGC场景化解决方案，辅助创作文案、图像、音视频等数字内容。自动驾驶实现车辆自主感知环境、规划路径和控制行驶。支持自动驾驶场景PB级数据下模型高效训练，助力自动驾驶特有的感知、规控、仿真生成等全链路相关算法深度优化并快速迭代。

帮助中心 > AI开发平台ModelArts > 产品介绍
单模型性能调优AOE - AI开发平台ModelArts

aoe_unet_graph.mindir --device=Ascend --numThreads=1 --parallelNum=1 --workersNum=1 --warmUpLoopCount=100 --loopCount=100 图1 调优前模型图2 调优后模型 AOE优化成功的mindir已经融合了优化的知识库

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
执行微调训练任务 - AI开发平台ModelArts

是否开启NPU FlashAttention融合算子，具体约束详见NPU_Flash_Attn融合算子约束是，配置以下参数。 flash_attn: sdpa 否，注释掉flash_attn: sdpa参数是否使用固定句长。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）

总条数： 652

上一页
1
...
28
29
30
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备工作 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

昇腾云服务6.3.910版本说明 - AI开发平台ModelArts

昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

创建ModelArts数据集 - AI开发平台ModelArts

应用场景 - AI开发平台ModelArts

单模型性能调优AOE - AI开发平台ModelArts

执行微调训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线