搜索_华为云

迁移过程使用工具概览 - AI开发平台ModelArts

父主题： GPU推理业务迁移至昇腾的通用指导

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导

训练迁移快速入门案例 - AI开发平台ModelArts

图2 torch_npu导入自动迁移完成GPU代码到昇腾的快速适配。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

请将完整的SWR地址复制到这里即可，或单击可直接从SWR选择自有镜像进行注册，类型加上“GPU”，如图1所示。图1 注册镜像登录ModelArts管理控制台，在左侧导航栏中选择“开发空间 > Notebook”，进入“Notebook”列表页面。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业

精度问题概述 - AI开发平台ModelArts

当用户将大语言模型或者其他类型深度神经网络的训练从GPU迁移到昇腾AI处理器时，可能出现以下不同现象的模型精度问题。一般包括： Loss曲线与CPU/GPU差异不符合预期。验证准确度与CPU/GPU差异不符合预期。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优

训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

迁移流程模型迁移主要指将开源社区中实现过的模型或客户自研模型迁移到昇腾AI处理器上，需要保证模型已经在CPU/GPU上运行成功。迁移到昇腾AI处理器的主要流程如下图所示。图1 迁移流程父主题： GPU训练业务迁移至昇腾的通用指导

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导

pipeline应用准备 - AI开发平台ModelArts

图2 生成图片父主题：基于AIGC模型的GPU推理业务迁移至昇腾指导

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导

Tesla驱动及CUDA工具包获取方式 - 弹性云服务器 ECS

图1 指定CUDA Toolkit软件版本选择对应的版本，下载CUDA软件包。父主题：管理GPU加速型ECS的GPU驱动

帮助中心 > 弹性云服务器 ECS > 用户指南 > 实例 > 管理GPU加速型ECS的GPU驱动

模型精度调优 - AI开发平台ModelArts

模型精度调优场景介绍精度问题诊断精度问题处理父主题：基于AIGC模型的GPU推理业务迁移至昇腾指导

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导

性能调优 - AI开发平台ModelArts

性能调优单模型性能测试工具Mindspore lite benchmark 单模型性能调优AOE 父主题：基于AIGC模型的GPU推理业务迁移至昇腾指导

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导

动态shape - AI开发平台ModelArts

适用于执行推理时，每次处理图片宽和高不固定的场景，该参数需要与input_shape配合使用，input_shape中-1的位置为动态分辨率所在的维度。使用方法可参考Ascend配置文件说明。父主题：模型适配

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配

模型适配 - AI开发平台ModelArts

python parse_models_shape.py 可以看到获取的shape信息如下图所示。图1 shape信息 PyTorch模型转换为Onnx模型（可选）获取onnx模型有以下两种方式。下文介绍如何通过方式一进行操作。如果采用方式二，可以跳过此步骤。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

父主题：基于ModelArts Standard运行GPU训练作业

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业

迁移效果校验 - AI开发平台ModelArts

对比图片生成效果在CPU上推理onnx，将原始onnx和适配完成的MindSpore Lite pipeline输出的结果图片进行对比，在这里保证输入图片及文本提示词一致。如果差异较为明显可以进行模型精度调优。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导

精度调优前准备工作 - AI开发平台ModelArts

常见的超参如下图所示：图1 训练超参数模型的超参通常可能调整的主要有学习率、batch size、并行切分策略、学习率warm-up、模型参数、FA配置等。用户在进行NPU精度和GPU精度比对前，需要保证两边的配置一致。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优

单模型性能调优AOE - AI开发平台ModelArts

--device=Ascend --numThreads=1 --parallelNum=1 --workersNum=1 --warmUpLoopCount=100 --loopCount=100 图1 调优前模型图2 调优后模型 AOE优化成功的mindir已经融合了优化的知识库

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优

使用Tensorflow训练神经网络 - 云容器实例 CCI

本文将演示在云容器实例中创建GPU类型的负载，以tensorflow的图像分类为示例，演示在容器中直接使用GPU训练一个简单的神经网络。

帮助中心 > 云容器实例 CCI > 最佳实践 > GPU负载

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

图1 netron中查看inputShape 精度选择。精度选择需要在模型转换阶段进行配置，执行converter_lite命令时通过--configFile参数指定配置文件路径，配置文件通过precision_mode参数指定精度模式。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配

MindSpore Lite问题定位指南 - AI开发平台ModelArts

MindSpore Lite问题定位指南在MindSpore Lite使用中遇到问题时，例如模型转换失败、训练后量化转换失败、模型推理失败、模型推理精度不理想、模型推理性能不理想、使用Visual Studio报错、使用Xcode构建APP报错等，您可以先查看日志信息进行定位分析

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 常见问题

安装GPU指标集成插件 - 云监控服务 CES

lspci -d 10de: 图1 安装结果如果安装完lspci后，安装结果显示命令不存在，可通过重启云服务器来解决。父主题：云监控插件（Agent）

帮助中心 > 云监控服务 CES > 用户指南 > 云资源监控 > 主机监控 > 云监控插件（Agent）

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

请将完整的SWR地址复制到这里即可，或单击可直接从SWR选择自有镜像进行注册，类型加上“GPU”，如图1所示。图1 注册镜像登录ModelArts管理控制台，在左侧导航栏中选择“开发空间 > Notebook”，进入“Notebook”列表页面。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业

迁移过程使用工具概览 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

精度问题概述 - AI开发平台ModelArts

训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

pipeline应用准备 - AI开发平台ModelArts

Tesla驱动及CUDA工具包获取方式 - 弹性云服务器 ECS

模型精度调优 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

迁移效果校验 - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

单模型性能调优AOE - AI开发平台ModelArts

使用Tensorflow训练神经网络 - 云容器实例 CCI

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

MindSpore Lite问题定位指南 - AI开发平台ModelArts

安装GPU指标集成插件 - 云监控服务 CES

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线