内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • GPU — 分布式训练

    文章目录 目录 分布式训练的挑战 算法挑战 工程挑战 NCCL MPI 分布式训练的挑战 算法挑战 数据并行或模型并行 同步或异步 批量较大,影响模型精度 热身,调整学习速率(线性上升,LARC/LARS)

    作者: 云物互联
    发表时间: 2022-07-14 16:00:23
    240
    0
  • ModelArts黑科技揭秘|弹性训练,让训练资源张弛有度

    进行优化,解决了上述问题,实现了训练的准确率不降低、加速比理想。 具体来说,华为弹性训练方案具有易用、高效、优雅的训练框架和等价的训练过程,普惠的强大算力、高利用率的资源四大优势。 易用、高效、优雅的训练框架 华为的弹性训练基于易用高效的训练框架,用户只需要根据要求,简单的修改代码,就可以满足弹性训练的要求。

    作者: 技术火炬手
    发表时间: 2020-12-28 10:30:52
    4217
    1
  • 06大规模并行模型训练

    基于Atlas 900 AI集群和深度学习训练平台进行BERT网络大规模并行模型训练

    播放量  2230
  • 【昇腾CANN训练营第二期】【模型营】使用PyCharm的ModelArts插件训练LeNet网络

    昇腾CANN训练营 模型营的实操作业出来了:https://bbs.huaweicloud.com/forum/forum.php?mod=viewthread&tid=135955&fromuid=446160 具体题目为:使用华为Ascend910在MNIS

    作者: 张辉
    发表时间: 2021-07-03 06:33:46
    2985
    1
  • 驻共创】有什么好用的深度学习gpu云服务器平台

    一、深度学习GPU云服务器平台概述 目前市面上有许多深度学习GPU云服务器平台,它们提供了丰富的计算资源和优质的服务,为深度学习研究者提供了强大的支持。这些平台通常具备高性能的GPU、大容量的存储和高速的网络连接,能够满足深度学习模型训练和推理的需求。   1.平台对比

    作者: 皮牙子抓饭
    发表时间: 2024-04-09 12:00:09
    14
    0
  • (Moxing篇一)自研深度学习MoXingAPI使模型训练再次升级

    原生API,使用MoXingAPI开发深度学习算法模型编程更加简单,而且能够自动获得高性能的分布式执行能力。</align><align=left><b>华为深度学习——高性能</b></align><align=left>华为深度学习的高效性是通过混合并行、梯度压缩、卷积加

    作者: freeborn0601
    18437
    5
  • 华为深度学习笔记2

    误差:训练误差:模型在训练集上的误差 &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp; 泛化误差:模型在新样本上的误差 &nbsp;&nbsp;&nbsp; 欠拟合:训练误差很大的现象 &nbsp;&nbsp;&nbsp; 过拟合:训练误差小

    作者: zzzzf
    发表时间: 2022-07-15 15:22:27
    250
    0
  • 联邦学习,打破模型训练数据安全限制难题

    作者:邵峰1、联邦学习 背景及技术回顾(图文穿插)传统机器学习通常需要把训练数据集集中在数据中心,从而带来安全、隐私等问题,联邦学习应运而生。联邦学习具有如下优势:1)数据不出本地:数据保留在各方本地,不泄露隐私也不违反法规2)模型效果相同:联邦学习模型效果和将全部数据统一存放

    作者: 就挺突然
    发表时间: 2021-03-11 15:55:58
    3216
    0
  • 【Verilog HDL 训练】第 05 天(序列检测)

    1. dff和latch有什么区别。 锁存器是一种对脉冲电平(也就是0或者1)敏感的存储单元电路,而触发器是一种对脉冲边沿(即上升沿或者下降沿)敏感的存储电路。 "触发器" 泛指一类电路结构, 它可以由触发信号 (如: 时钟, 置位, 复位等) 改变输出状态, 并保持

    作者: 李锐博恩
    发表时间: 2021-07-14 21:08:57
    1064
    0
  • 【Verilog HDL 训练】第 10 天(PWM 呼吸灯)

    5月8日 PWM 用verilog实现PWM控制呼吸灯。呼吸周期2秒:1秒逐渐变亮,1秒逐渐变暗。系统时钟24MHz,pwm周期1ms,精度1us。 今天的题目我是第一次见,答案借鉴大神的:Verilog没有葵花宝典打卡day10.md 简述PWM PWM——脉宽调制信号(Pulse

    作者: 李锐博恩
    发表时间: 2021-07-14 20:14:28
    1055
    0
  • 《智能系统与技术丛书 深度学习实践:基于Caffe的解析》—3.3.3训练脚本的编写

    3.3.3 训练脚本的编写 编写好了solver文件和网络文件之后,接下来就是执行训练的过程了,我们先来看看从头开始训练的命令方法吧,一般是使用随机初始化的方式开始训练。 以下是随机初始化训练的脚本代码:./build/tools/caffe train \ --solver=m

    作者: 华章计算机
    发表时间: 2019-06-02 16:15:38
    5250
    0
  • 强化学习 游戏训练 谷歌足球 vizdoom

    原文:华为https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=627f8ed5-7213-464c-afa0-f125e0c5e687 这个框架主要是训练游戏的,大致看了下,目前可以训练的游戏类型包含

    作者: i淇淇子
    发表时间: 2021-09-17 03:33:44
    1589
    1
  • 域对抗(域适应)训练

    在传统监督学习中,我们经常需要大量带标签的数据进行训练,并且需要保证训练集和测试集中的数据分布相似。如果训练集和测试集的数据具有不同的分布,训练后的分类器在测试集上就没有好的表现。这种情况下该怎么办呢? 域适应(Domain Ada

    作者: 风吹稻花香
    发表时间: 2022-03-30 15:29:16
    653
    0
  • MATLAB在机器学习模型训练中的应用与优化方法

    通过调整学习率,可以提高模型的收敛速度,并且在不同阶段选择合适的学习率进行训练。 6. 深度学习与传统机器学习的结合 在实际应用中,深度学习和传统机器学习方法往往是互补的。MATLAB支持将深度学习模型与传统机器学习模型结合使用,以便更好地解决复杂问题。通过结合深度学习的特征提取

    作者: 柠檬味拥抱1
    发表时间: 2025-02-21 11:35:45
    0
    0
  • 深度学习 | 反向传播】释放反向传播的力量: 让训练神经网络变得简单

    然硬件还没开始玩,但一直很感兴趣!希望大佬带带) 该文章收录专栏 [✨— 《深入解析机器学习:从原理到应用的全面指南》 —✨] 反向传播算法 反向传播算法是一种用于训练神经网络的常用优化算法。它通过计算损失函数对每个参数的梯度,然后根据这些梯度更新参数值,以使得神经网络能够逐步调整和改进其预测结果。

    作者: 计算机魔术师
    发表时间: 2023-08-25 10:50:44
    43
    0
  • 【Verilog HDL 训练】第 04 天(竞争、冒险、译码等)

    着两个与门的结果会变化,再到达或门,这又变成了有多个输入同时变化问题了。 【 FPGA 】组合逻辑中的竞争与险象问题(二) 这篇博文深度剖析了什么是竞争的问题,原书作者独创性地提出了半开关的概念: &nbsp;门电路的开关特性 下面提到的开关,开代表接通状态,关闭代表断开状态。

    作者: 李锐博恩
    发表时间: 2021-07-14 18:42:18
    1230
    0
  • pytorch 多GPU训练

    pytorch 多GPU训练 pytorch多GPU最终还是没搞通,可用的部分是前向计算,back propagation会出错,当时运行通过,也不太确定是如何通过了的。目前是这样,有机会再来补充 pytorch支持多GPU训练,官方文档(pytorch 0.

    作者: 风吹稻花香
    发表时间: 2021-06-04 17:21:31
    1516
    0
  • vits训练适配昇腾

    1.启动训练训练LJ Speech为例,前提:下载好训练代码,准备好数据集,将软件升级包挂载到容器中(建议将数据集、代码、软件包放在同一文件夹下挂载到容器) 下载代码: https://github.com/jaywalnut310/vits 1.1  安装训练依赖的三方库

    作者: 昇腾适配
    发表时间: 2024-11-22 14:44:52
    388
    0
  • 如何查看训练结果?

    提交训练任务后,如果想看output目录下的结果,如果使用WebIDE,点击左边NAIE图标 -&gt; Job Explorer -&gt; 对应任务的output目录。如果使用编辑器,点击最左边的3个图标最后一个,如下图红框处,即“任务目录”,点开对应的训练的任务就可以看到每

    作者: 就挺突然
    发表时间: 2021-06-02 15:57:34
    1206
    0
  • TensorFlow模型训练常见案例

    此问题是由于数据预处理脚本中存在tf.Variable变量。训练脚本在昇腾平台运行时,tf.Variable变量在Host侧执行,而tf.Variable变量的初始化在Device侧执行,变量执行和变量初始化不在同一设备执行,导致训练异常。 使用了tf.Variable的训练脚本代码示例如下: batch_size

    作者: 昇腾CANN
    发表时间: 2023-11-05 11:54:37
    554
    0