搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

GPU — 分布式训练
GPU — 分布式训练

文章目录目录分布式训练的挑战算法挑战工程挑战 NCCL MPI 分布式训练的挑战算法挑战数据并行或模型并行同步或异步批量较大，影响模型精度热身，调整学习速率（线性上升，LARC/LARS）

开发者 > 博客

作者：云物互联

发表时间： 2022-07-14 16:00:23

240

0
ModelArts黑科技揭秘|弹性训练，让训练资源张弛有度

进行优化，解决了上述问题，实现了训练的准确率不降低、加速比理想。具体来说，华为云弹性训练方案具有易用、高效、优雅的训练框架和等价的训练过程，普惠的强大算力、高利用率的云资源四大优势。易用、高效、优雅的训练框架华为云的弹性训练基于易用高效的训练框架，用户只需要根据要求，简单的修改代码，就可以满足弹性训练的要求。

开发者 > 博客

作者：技术火炬手

发表时间： 2020-12-28 10:30:52

4217

1
06大规模并行模型训练

06大规模并行模型训练

基于Atlas 900 AI集群和深度学习训练平台进行BERT网络大规模并行模型训练。

开发者 > 视频

播放量 2230
【昇腾CANN训练营第二期】【模型营】使用PyCharm的ModelArts插件训练LeNet网络

昇腾CANN训练营模型营的实操作业出来了：https://bbs.huaweicloud.com/forum/forum.php?mod=viewthread&tid=135955&fromuid=446160 具体题目为：使用华为云Ascend910在MNIS

开发者 > 博客

作者：张辉

发表时间： 2021-07-03 06:33:46

2985

1
【云驻共创】有什么好用的深度学习gpu云服务器平台

一、深度学习GPU云服务器平台概述目前市面上有许多深度学习GPU云服务器平台，它们提供了丰富的计算资源和优质的服务，为深度学习研究者提供了强大的支持。这些平台通常具备高性能的GPU、大容量的存储和高速的网络连接，能够满足深度学习模型训练和推理的需求。   1.平台对比

开发者 > 博客

作者：皮牙子抓饭

发表时间： 2024-04-09 12:00:09

14

0
（Moxing篇一）自研深度学习MoXingAPI使模型训练再次升级

原生API，使用MoXingAPI开发深度学习算法模型编程更加简单，而且能够自动获得高性能的分布式执行能力。</align><align=left><b>华为云深度学习——高性能</b></align><align=left>华为云深度学习的高效性是通过混合并行、梯度压缩、卷积加

开发者 > 其他

作者： freeborn0601

18437

5
华为云深度学习笔记2
华为云深度学习笔记2

误差：训练误差：模型在训练集上的误差          泛化误差：模型在新样本上的误差     欠拟合：训练误差很大的现象     过拟合：训练误差小

开发者 > 博客

作者： zzzzf

发表时间： 2022-07-15 15:22:27

250

0
联邦学习，打破模型训练数据安全限制难题

作者：邵云峰1、联邦学习背景及技术回顾（图文穿插）传统机器学习通常需要把训练数据集集中在数据中心，从而带来安全、隐私等问题，联邦学习应运而生。联邦学习具有如下优势：1）数据不出本地：数据保留在各方本地，不泄露隐私也不违反法规2）模型效果相同：联邦学习模型效果和将全部数据统一存放

开发者 > 博客

作者：就挺突然

发表时间： 2021-03-11 15:55:58

3216

0
【Verilog HDL 训练】第 05 天（序列检测）

1. dff和latch有什么区别。锁存器是一种对脉冲电平（也就是0或者1）敏感的存储单元电路，而触发器是一种对脉冲边沿（即上升沿或者下降沿）敏感的存储电路。 "触发器" 泛指一类电路结构, 它可以由触发信号 (如: 时钟, 置位, 复位等) 改变输出状态, 并保持

开发者 > 博客

作者：李锐博恩

发表时间： 2021-07-14 21:08:57

1064

0
【Verilog HDL 训练】第 10 天（PWM 呼吸灯）

5月8日 PWM 用verilog实现PWM控制呼吸灯。呼吸周期2秒：1秒逐渐变亮，1秒逐渐变暗。系统时钟24MHz，pwm周期1ms，精度1us。今天的题目我是第一次见，答案借鉴大神的：Verilog没有葵花宝典打卡day10.md 简述PWM PWM——脉宽调制信号（Pulse

开发者 > 博客

作者：李锐博恩

发表时间： 2021-07-14 20:14:28

1055

0
《智能系统与技术丛书深度学习实践：基于Caffe的解析》—3.3.3训练脚本的编写

3.3.3　训练脚本的编写编写好了solver文件和网络文件之后，接下来就是执行训练的过程了，我们先来看看从头开始训练的命令方法吧，一般是使用随机初始化的方式开始训练。以下是随机初始化训练的脚本代码：./build/tools/caffe train \ --solver=m

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-02 16:15:38

5250

0
强化学习游戏训练谷歌足球 vizdoom

原文：华为云https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=627f8ed5-7213-464c-afa0-f125e0c5e687 这个框架主要是训练游戏的，大致看了下，目前可以训练的游戏类型包含

开发者 > 博客

作者： i淇淇子

发表时间： 2021-09-17 03:33:44

1589

1
域对抗（域适应）训练
域对抗（域适应）训练

在传统监督学习中，我们经常需要大量带标签的数据进行训练，并且需要保证训练集和测试集中的数据分布相似。如果训练集和测试集的数据具有不同的分布，训练后的分类器在测试集上就没有好的表现。这种情况下该怎么办呢？域适应（Domain Ada

开发者 > 博客

作者：风吹稻花香

发表时间： 2022-03-30 15:29:16

653

0
MATLAB在机器学习模型训练中的应用与优化方法

通过调整学习率，可以提高模型的收敛速度，并且在不同阶段选择合适的学习率进行训练。 6. 深度学习与传统机器学习的结合在实际应用中，深度学习和传统机器学习方法往往是互补的。MATLAB支持将深度学习模型与传统机器学习模型结合使用，以便更好地解决复杂问题。通过结合深度学习的特征提取

开发者 > 博客

作者：柠檬味拥抱1

发表时间： 2025-02-21 11:35:45

0

0
【深度学习 | 反向传播】释放反向传播的力量: 让训练神经网络变得简单

然硬件还没开始玩，但一直很感兴趣！希望大佬带带）该文章收录专栏 [✨— 《深入解析机器学习：从原理到应用的全面指南》 —✨] 反向传播算法反向传播算法是一种用于训练神经网络的常用优化算法。它通过计算损失函数对每个参数的梯度，然后根据这些梯度更新参数值，以使得神经网络能够逐步调整和改进其预测结果。

开发者 > 博客

作者：计算机魔术师

发表时间： 2023-08-25 10:50:44

43

0
【Verilog HDL 训练】第 04 天（竞争、冒险、译码等）

着两个与门的结果会变化，再到达或门，这又变成了有多个输入同时变化问题了。【 FPGA 】组合逻辑中的竞争与险象问题（二）这篇博文深度剖析了什么是竞争的问题，原书作者独创性地提出了半开关的概念：  门电路的开关特性下面提到的开关，开代表接通状态，关闭代表断开状态。

开发者 > 博客

作者：李锐博恩

发表时间： 2021-07-14 18:42:18

1230

0
pytorch 多GPU训练
pytorch 多GPU训练

pytorch 多GPU训练 pytorch多GPU最终还是没搞通，可用的部分是前向计算，back propagation会出错，当时运行通过，也不太确定是如何通过了的。目前是这样，有机会再来补充 pytorch支持多GPU训练，官方文档（pytorch 0.

开发者 > 博客

作者：风吹稻花香

发表时间： 2021-06-04 17:21:31

1516

0
vits训练适配昇腾
vits训练适配昇腾

1.启动训练以训练LJ Speech为例，前提:下载好训练代码，准备好数据集，将软件升级包挂载到容器中(建议将数据集、代码、软件包放在同一文件夹下挂载到容器) 下载代码： https://github.com/jaywalnut310/vits 1.1 安装训练依赖的三方库

开发者 > 博客

作者：昇腾适配

发表时间： 2024-11-22 14:44:52

388

0
如何查看训练结果？
如何查看训练结果？

提交训练任务后，如果想看output目录下的结果，如果使用WebIDE，点击左边NAIE图标 -> Job Explorer -> 对应任务的output目录。如果使用编辑器，点击最左边的3个图标最后一个，如下图红框处，即“任务目录”，点开对应的训练的任务就可以看到每

开发者 > 博客

作者：就挺突然

发表时间： 2021-06-02 15:57:34

1206

0
TensorFlow模型训练常见案例
TensorFlow模型训练常见案例

此问题是由于数据预处理脚本中存在tf.Variable变量。训练脚本在昇腾平台运行时，tf.Variable变量在Host侧执行，而tf.Variable变量的初始化在Device侧执行，变量执行和变量初始化不在同一设备执行，导致训练异常。使用了tf.Variable的训练脚本代码示例如下： batch_size

开发者 > 博客

作者：昇腾CANN

发表时间： 2023-11-05 11:54:37

554

0

总条数： 10000

上一页
1
...
9
10
11
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU — 分布式训练

ModelArts黑科技揭秘|弹性训练，让训练资源张弛有度

06大规模并行模型训练

【昇腾CANN训练营第二期】【模型营】使用PyCharm的ModelArts插件训练LeNet网络

【云驻共创】有什么好用的深度学习gpu云服务器平台

（Moxing篇一）自研深度学习MoXingAPI使模型训练再次升级

华为云深度学习笔记2

联邦学习，打破模型训练数据安全限制难题

【Verilog HDL 训练】第 05 天（序列检测）

【Verilog HDL 训练】第 10 天（PWM 呼吸灯）

《智能系统与技术丛书深度学习实践：基于Caffe的解析》—3.3.3训练脚本的编写

强化学习游戏训练谷歌足球 vizdoom

域对抗（域适应）训练

MATLAB在机器学习模型训练中的应用与优化方法

【深度学习 | 反向传播】释放反向传播的力量: 让训练神经网络变得简单

【Verilog HDL 训练】第 04 天（竞争、冒险、译码等）

pytorch 多GPU训练

vits训练适配昇腾

如何查看训练结果？

TensorFlow模型训练常见案例

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线