搜索_华为云

已找到以下 10000 条记录

AI平台ModelArts

ModelArts是面向开发者的一站式AI开发平台，为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成，及端-边-云模型按需部署能力，帮助用户快速创建和部署模型，管理全周期AI工作流。

购买控制台文档

AI平台ModelArts

购买 AI Gallery 1对1咨询

【Mindspore】【Ascend训练】半精度和单精度不匹配问题

),loss_scale=args.loss_scale) is_gpu = context.get_context("device_target") == "GPU" if is_gpu: loss_scale_value = 1.0

开发者 > 其他

作者： Bluebear

1568

5
测量精度与术语单精度和双精度之间的差别

测量精度与术语单精度和双精度之间的差别？

开发者 > 其他

作者：建赟

1076

2
GPU加速型 - 弹性云服务器 ECS
GPU加速型 - 弹性云服务器 ECS

NVIDIA V100 NVLink （GPU直通） 5120 15.7TFLOPS 单精度浮点计算 7.8TFLOPS 双精度浮点计算 125TFLOPS Tensor Core 深度学习加速 300GiB/s NVLINK 机器学习、深度学习、训练推理、科学计算、地震分析、计算金融学、渲染、多媒体编解码。

帮助中心 > 弹性云服务器 ECS > 产品介绍 > 实例类型和规格 > 实例规格（x86）
在Ascend上训练精度与GPU上精度差距较大

系统环境硬件环境(Ascend/GPU/CPU): AscendMindSpore版本: 不限版本执行模式（动态图）: 不限模式Python版本: 3.7/3.8/3.9操作系统平台: linux2 报错信息2.1 问题描述在GPU上训练精度达标，但是在Ascend上训练时精度和GPU差距较大，有可

开发者 > 其他

作者：埼玉

61

0
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

精度校验迁移之后的精度校验工作是以CPU/GPU环境训练过程作为标杆的，这里的前提是在迁移前，模型已经在CPU/GPU环境达到预期训练结果。在此基础上，迁移过程的精度问题一般包括： Loss曲线与CPU/GPU差异不符合预期。验证准确度与CPU/GPU差异不符合预期。在迁移

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
精度问题处理 - AI开发平台ModelArts

精度问题处理设置高精度并重新转换模型在转换模型时，默认采用的精度模式是fp16，如果转换得到的模型和标杆数据的精度差异比较大，可以使用fp32精度模式提升模型的精度（精度模式并不总是需要使用fp32，因为相对于fp16，fp32的性能较差。因此，通常只在检测到某个模型精度存在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
mindspore模型训练—混合精度算法

而混合精度训练的方法中则增加了通过16位浮点数（FP16）进行深度学习模型训练，从而减少了训练深度学习模型所需的内存，同时由于FP16的运算比FP32运算更快，从而也进一步提高了硬件效率。    **混合精度训练方法**是通过混合使用单精度和半精度数据格式来

开发者 > 博客

作者： leid_lzu

发表时间： 2021-11-02 05:16:32

1891

0
精度对齐 - AI开发平台ModelArts
精度对齐 - AI开发平台ModelArts

精度对齐精度问题是指模型从GPU设备迁移到昇腾NPU设备之后由于软硬件差异引入的精度问题。根据是否在单卡环境下，可分为单卡精度问题与多卡精度问题。多卡相对于单卡，会有卡与卡之间的通信，这可能也是精度偏差的一种来源。所以多卡的精度对齐问题相对于单卡会更复杂。不过针对多卡的精度问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

精度校验转换模型后执行推理前，可以使用benchmark工具对MindSpore Lite云侧推理模型进行基准测试。它不仅可以对MindSpore Lite云侧推理模型前向推理执行耗时进行定量分析（性能），还可以通过指定模型输出进行可对比的误差分析（精度）。精度测试 benc

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
Ascend 910单精度训练速度很慢
Ascend 910单精度训练速度很慢

RTX快很多。请高人指点。上述现象，是TensorFlow适配的问题吗？还是Ascend 910最好就是要使用混合精度？或者是TensorFlow在Titan RTX等带有Tensor Core的卡上自动优化了混合精度？

开发者 > 其他

作者：皮皮鲁

1386

1
Msprobe精度比对 - AI开发平台ModelArts

Msprobe精度比对精度比对功能主要针对两类场景的问题：同一模型，从CPU或GPU移植到NPU中存在精度下降问题，对比NPU芯片中的API计算数值与CPU或GPU芯片中的API计算数值，进行问题定位。同一模型，进行迭代（模型、框架版本升级或设备硬件升级）时存在的精度下降问题，

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优 > Msprobe工具使用指导
精度调优总体思路 - AI开发平台ModelArts

这样会大大降低后续定位的难度。根据精度问题现象可以选择合适的定位方式，Msprobe是MindStudio Training Tools工具链下精度调试部分的工具包，主要包括精度预检、溢出检测和精度比对等功能，通过采集和对比标杆（GPU/CPU）环境和昇腾环境上运行训练时的差

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
精度问题诊断 - AI开发平台ModelArts

得到和标杆数据相同的输出，因此可以判断出转换得到的text_encoder模型是产生pipeline精度误差的根因。通过下一小节可以进一步确认模型精度的差异。父主题：模型精度调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
精度对齐 - AI开发平台ModelArts
精度对齐 - AI开发平台ModelArts

精度对齐长训Loss比对结果使用Msprobe工具分析偏差 Loss对齐结果父主题： Dit模型Pytorch迁移与精度性能调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型Pytorch迁移与精度性能调优
模型精度调优 - AI开发平台ModelArts

模型精度调优场景介绍精度问题诊断精度问题处理父主题：基于AIGC模型的GPU推理业务迁移至昇腾指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
数据精度 - 成本中心
数据精度 - 成本中心

数据精度原始成本的数据精度和账单金额一致。摊销成本需要按照四舍五入进行保留小数，因此摊销成本会存在微小的精度差异：成本中心页面上展示的金额，均按照四舍五入规则，保留2位小数；导出的成本明细数据，会根据成本数据的原始精度，保留8位小数。需要进行分摊的数据包括：包年/包月的订单金额。

帮助中心 > 成本中心 > 用户指南 > 概述
PyTorch迁移精度调优 - AI开发平台ModelArts

PyTorch迁移精度调优引言精度校验精度调优总体思路准备工作问题复现 Msprobe工具使用指导父主题： GPU训练业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
[JavaSE] 数据类型（变量、整形、长整型、双精度浮点、单精度浮点、字符、字节）

点击并拖拽以移动               1.3 双精度浮点型变量(重点)       基本语法格式 double 变量名 = 初始值; 点击并拖拽以移动  

开发者 > 博客

作者： Nick_Bears

发表时间： 2022-04-02 16:13:40

702

0
Loss对齐结果 - AI开发平台ModelArts

Loss对齐结果在排查完精度偏差来源之后发现，Loss最大绝对偏差减少为0.0003，Loss结果对齐。需要注意训练引入随机性的目的是为了增加结果的鲁棒性，理论上不会对训练模型的收敛与否造成影响。此处做随机性固定主要的目的是为了训练结果可完全复现，从而实现NPU和标杆的精度对齐。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型Pytorch迁移与精度性能调优 > 精度对齐
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

模型的超参通常可能调整的主要有学习率、batch size、并行切分策略、学习率warm-up、模型参数、FA配置等。用户在进行NPU精度和GPU精度比对前，需要保证两边的配置一致。表1 超参说明超参说明学习率影响模型收敛程度，决定了模型在每次更新权重时所采用的步长。学习率过高，模型可

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

AI平台ModelArts

【Mindspore】【Ascend训练】半精度和单精度不匹配问题

测量精度与术语单精度和双精度之间的差别

GPU加速型 - 弹性云服务器 ECS

在Ascend上训练精度与GPU上精度差距较大

精度校验 - AI开发平台ModelArts

精度问题处理 - AI开发平台ModelArts

mindspore模型训练—混合精度算法

精度对齐 - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

Ascend 910单精度训练速度很慢

Msprobe精度比对 - AI开发平台ModelArts

精度调优总体思路 - AI开发平台ModelArts

精度问题诊断 - AI开发平台ModelArts

精度对齐 - AI开发平台ModelArts

模型精度调优 - AI开发平台ModelArts

数据精度 - 成本中心

PyTorch迁移精度调优 - AI开发平台ModelArts

[JavaSE] 数据类型（变量、整形、长整型、双精度浮点、单精度浮点、字符、字节）

Loss对齐结果 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线