搜索_华为云

已找到以下 10000 条记录

AI平台ModelArts

ModelArts是面向开发者的一站式AI开发平台，为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成，及端-边-云模型按需部署能力，帮助用户快速创建和部署模型，管理全周期AI工作流。

购买控制台文档

AI平台ModelArts

购买 AI Gallery 1对1咨询

【Mindspore】【Ascend训练】半精度和单精度不匹配问题

),loss_scale=args.loss_scale) is_gpu = context.get_context("device_target") == "GPU" if is_gpu: loss_scale_value = 1.0

开发者 > 其他

作者： Bluebear

1569

5
测量精度与术语单精度和双精度之间的差别

测量精度与术语单精度和双精度之间的差别？

开发者 > 其他

作者：建赟

1076

2
在Ascend上训练精度与GPU上精度差距较大

系统环境硬件环境(Ascend/GPU/CPU): AscendMindSpore版本: 不限版本执行模式（动态图）: 不限模式Python版本: 3.7/3.8/3.9操作系统平台: linux2 报错信息2.1 问题描述在GPU上训练精度达标，但是在Ascend上训练时精度和GPU差距较大，有可

开发者 > 其他

作者：埼玉

62

0
精度问题概述 - AI开发平台ModelArts

户自行或在支持下排查可能的数值计算精度问题。当用户将大语言模型或者其他类型深度神经网络的训练从GPU迁移到昇腾AI处理器时，可能出现以下不同现象的模型精度问题。一般包括： Loss曲线与CPU/GPU差异不符合预期。验证准确度与CPU/GPU差异不符合预期。在迁移到NPU环

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
mindspore模型训练—混合精度算法

而混合精度训练的方法中则增加了通过16位浮点数（FP16）进行深度学习模型训练，从而减少了训练深度学习模型所需的内存，同时由于FP16的运算比FP32运算更快，从而也进一步提高了硬件效率。    **混合精度训练方法**是通过混合使用单精度和半精度数据格式来

开发者 > 博客

作者： leid_lzu

发表时间： 2021-11-02 05:16:32

1891

0
精度问题处理 - AI开发平台ModelArts

精度问题处理设置高精度并重新转换模型在转换模型时，默认采用的精度模式是fp16，如果转换得到的模型和标杆数据的精度差异比较大，可以使用fp32精度模式提升模型的精度（精度模式并不总是需要使用fp32，因为相对于fp16，fp32的性能较差。因此，通常只在检测到某个模型精度存在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
GPU加速型 - 弹性云服务器 ECS
GPU加速型 - 弹性云服务器 ECS

NVIDIA V100 NVLink （GPU直通） 5120 15.7TFLOPS 单精度浮点计算 7.8TFLOPS 双精度浮点计算 125TFLOPS Tensor Core 深度学习加速 300GiB/s NVLINK 机器学习、深度学习、训练推理、科学计算、地震分析、计算金融学、渲染、多媒体编解码。

帮助中心 > 弹性云服务器 ECS > 产品介绍 > 实例类型和规格 > 实例规格（x86）
浅谈深度学习中的混合精度训练

浅谈深度学习中的混合精度训练大家好，本次博客为大家介绍一下深度学习中的混合精度训练，并通过代码实战的方式为大家讲解实际应用的理论，并对模型进行测试。 1 混合精度训练混合精度训练最初是在论文Mixed Precision Training中被提出，该论文对混合精度训练进行

开发者 > 博客

作者：李长安

发表时间： 2023-03-17 12:57:28

1095

1
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

精度校验转换模型后执行推理前，可以使用benchmark工具对MindSpore Lite云侧推理模型进行基准测试。它不仅可以对MindSpore Lite云侧推理模型前向推理执行耗时进行定量分析（性能），还可以通过指定模型输出进行可对比的误差分析（精度）。精度测试 benc

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
Ascend 910单精度训练速度很慢
Ascend 910单精度训练速度很慢

RTX快很多。请高人指点。上述现象，是TensorFlow适配的问题吗？还是Ascend 910最好就是要使用混合精度？或者是TensorFlow在Titan RTX等带有Tensor Core的卡上自动优化了混合精度？

开发者 > 其他

作者：皮皮鲁

1386

1
精度问题诊断 - AI开发平台ModelArts

得到和标杆数据相同的输出，因此可以判断出转换得到的text_encoder模型是产生pipeline精度误差的根因。通过下一小节可以进一步确认模型精度的差异。父主题：模型精度调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
精度调优总体思路 - AI开发平台ModelArts

精度达标，然后再恢复层数拉起多机训练。若单机精度正常但多机精度异常，有可能是多机通信造成的精度问题，此时可以用精度工具的通信精度检测功能进行定位。部分集合通信算子要求通信域内各rank结果一致，如AllReduce、AllGather等，利用这一特性，工具将多机模型训练中产生的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

DeepSpeed的核心思想是在单个GPU上实现大规模模型并行训练，从而提高训练速度。DeepSpeed提供了一系列的优化技术，如ZeRO内存优化、分布式训练等，可以帮助用户更好地利用多个GPU进行训练 Accelerate是一种深度学习加速框架，主要针对分布式训练场景。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
精度对齐 - AI开发平台ModelArts
精度对齐 - AI开发平台ModelArts

精度对齐长训Loss比对结果使用Msprobe工具分析偏差 Loss对齐结果父主题： Dit模型Pytorch迁移与精度性能调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型Pytorch迁移与精度性能调优
精度调优前准备工作 - AI开发平台ModelArts

模型的超参通常可能调整的主要有学习率、batch size、并行切分策略、学习率warm-up、模型参数、FA配置等。用户在进行NPU精度和GPU精度比对前，需要保证两边的配置一致。表1 超参说明超参说明学习率影响模型收敛程度，决定了模型在每次更新权重时所采用的步长。学习率过高，模型可

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
模型精度调优 - AI开发平台ModelArts

模型精度调优场景介绍精度问题诊断精度问题处理父主题：基于AIGC模型的GPU推理业务迁移至昇腾指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
数据精度 - 成本中心
数据精度 - 成本中心

数据精度原始成本的数据精度和账单金额一致。摊销成本需要按照四舍五入进行保留小数，因此摊销成本会存在微小的精度差异：成本中心页面上展示的金额，均按照四舍五入规则，保留2位小数；导出的成本明细数据，会根据成本数据的原始精度，保留8位小数。需要进行分摊的数据包括：包年/包月的订单金额。

帮助中心 > 成本中心 > 用户指南 > 概述
PyTorch迁移精度调优 - AI开发平台ModelArts

PyTorch迁移精度调优精度问题概述精度调优总体思路精度调优前准备工作 msprobe精度分析工具使用指导父主题： GPU训练业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
[JavaSE] 数据类型（变量、整形、长整型、双精度浮点、单精度浮点、字符、字节）

点击并拖拽以移动               1.3 双精度浮点型变量(重点)       基本语法格式 double 变量名 = 初始值; 点击并拖拽以移动  

开发者 > 博客

作者： Nick_Bears

发表时间： 2022-04-02 16:13:40

702

0
msprobe精度分析工具使用指导 - AI开发平台ModelArts

msprobe精度分析工具使用指导 msprobe是MindStudio Training Tools工具链下精度调试部分的工具包，其通过采集和对比标杆（GPU/CPU）环境和昇腾环境上运行训练时的差异点来判断问题所在，主要包括精度预检、精度比对和梯度监控等功能。更多内容请参考msprobe工具介绍。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
Loss对齐结果 - AI开发平台ModelArts

Loss对齐结果在排查完精度偏差来源之后发现，Loss最大绝对偏差减少为0.0003，Loss结果对齐。需要注意训练引入随机性的目的是为了增加结果的鲁棒性，理论上不会对训练模型的收敛与否造成影响。此处做随机性固定主要的目的是为了训练结果可完全复现，从而实现NPU和标杆的精度对齐。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型Pytorch迁移与精度性能调优 > 精度对齐

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

AI平台ModelArts

【Mindspore】【Ascend训练】半精度和单精度不匹配问题

测量精度与术语单精度和双精度之间的差别

在Ascend上训练精度与GPU上精度差距较大

精度问题概述 - AI开发平台ModelArts

mindspore模型训练—混合精度算法

精度问题处理 - AI开发平台ModelArts

GPU加速型 - 弹性云服务器 ECS

浅谈深度学习中的混合精度训练

精度校验 - AI开发平台ModelArts

Ascend 910单精度训练速度很慢

精度问题诊断 - AI开发平台ModelArts

精度调优总体思路 - AI开发平台ModelArts

各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

精度对齐 - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

模型精度调优 - AI开发平台ModelArts

数据精度 - 成本中心

PyTorch迁移精度调优 - AI开发平台ModelArts

[JavaSE] 数据类型（变量、整形、长整型、双精度浮点、单精度浮点、字符、字节）

msprobe精度分析工具使用指导 - AI开发平台ModelArts

Loss对齐结果 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线