内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • PyTorch进阶训练技巧

    动态调整学习学习率的选择是深度学习中一个困扰人们许久的问题,学习速率设置过小,会极大降低收敛速度,增加训练时间;学习率太大,可能导致参数在最优解两侧来回振荡。但是当我们选定了一个合适的学习率后,经过许多轮的训练后,可能会出现准确率震荡或loss不再下降等情况,说明当前学习率已不

    作者: livingbody
    发表时间: 2022-11-21 16:53:41
    160
    0
  • yolov3在modelarts平台训练报错

    报错信息如下Traceback (most recent call last): File "/home/work/user-job-dir/yolov4/train.py", line 344, in <module> train() File "/home/work/user

    作者: 枫少
    1537
    3
  • 机器学习13-训练模型的坑

    很多常见情况会导致反向传播算法出错。 梯度消失 较低层(更接近输入)的梯度可能会变得非常小。在深度网络中,计算这些梯度时,可能涉及许多小项的乘积。 当较低层的梯度逐渐消失到0时,这些层的训练速度会非常缓慢,甚至不再训练。 策略:ReLU激活函数有助于防止梯度消失。 梯度爆炸 如果网络中的权重过

    作者: 一颗小树x
    发表时间: 2021-06-18 13:50:01
    2040
    0
  • ModelArts训练作业预置框架自定义配置深度学习框架版本

    当前ModelArts各功能都只支持有限的框架版本,如果想要使用一个预置框架没有的版本应该如何处理?下面以pytorch 1.5和tensorflow 1.14为例,如何在训练作业预置框架进行动态配置Pytorch 1.5和tensorflow 1.14Pytorch 1.5要基于cuda 10.1版本以上,tensorflow

    作者: 星月菩提
    发表时间: 2020-11-24 09:21:24
    1724
    0
  • ModelArts平台介绍

    一.三种模式对比业务开发者:使用自动学习构建模型 AI 初学者:使用预置算法构建模型 AI 工程师:AI 全流程开发 二.AI全流程开发步骤整理         (一).名词解释:机器学习:研究计算机怎样模拟或实现人类的学习行为。      深度学习:机器学习(ML, Machine Learning)领域中一个新的研究方向

    作者: WD互联
    发表时间: 2020-07-17 11:44:28
    8101
    0
  • 【华为-上之路】手把手教你在Pycharm中调用ModelArts平台训练和部署模型

    I。华为作为底座,为华为全栈全场景AI战略提供强大的算力平台和更易用的开发平台。华为官方网站ModelArts是华为产品中面向开发者的一站式AI开发平台,为机器学习深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成,及端-边-模型按需

    作者: 看那个码农
    发表时间: 2020-06-06 15:48:40
    14320
    0
  • CBC运营管理平台---已有产品下新增按需规格和按需套餐包

    已有产品下新增按需规格和按需套餐包 Grow运营管理平台权限申请 登录Grow运营管理平台Console:https://cbc.huaweicloud.com/bm/?src=sidebar#/cloudproduct/growconsole 根据需要申请相应产品的运营权限,需通过主管和产品经理审批。

    作者: 阿杜
    发表时间: 2021-07-19 12:05:12
    1585
    0
  • 深度学习进阶篇-预训练模型1:预训练分词Subword、ELMo、Transformer模型原理;结构;技巧以及应用详解

    深度学习进阶篇-预训练模型[1]:预训练分词Subword、ELMo、Transformer模型原理;结构;技巧以及应用详解 从字面上看,预训练模型(pre-training model)是先通过一批语料进行训练模型,然后在这个初步训练好的模型基础上,再继续训练或者另作他用。这

    作者: 汀丶
    发表时间: 2023-05-24 10:42:54
    9
    0
  • 机器学习3-训练与损失

    ​前言 训练模型表示通过有标签样本学习模型中所有权重w和偏差b的最优值。在监督学习中,机器学习算法通过以下方式构建模型:检查多个样本并尝试找出可最大限度地减少模型的损失;这一过程称为经验风险最小化。 损失是对糟糕预测的惩罚;损失是之歌数值,表示对个单个样本而言模型预测的准确程度。

    作者: 一颗小树x
    发表时间: 2021-06-18 13:21:56
    1449
    0
  • 模型训练与CANN平台部署(Mindspore-TF)

    本课程主要介绍如何让TensorFlow脚本运行在昇腾910处理器上,并进行精度、性能等方面的调优。

  • 一次训练、多端部署——华为提出宽度和深度可伸缩的动态预训练模型DynaBERT

    一步提升蒸馏效果。图4:利用知识蒸馏训练宽度可伸缩的DynaBERTw。 宽度和深度同时可伸缩的DynaBERT训练方法在训练DynaBERTw之后,我们进一步使用知识蒸馏来训练宽度和深度的同时可伸缩的DynaBERT。具体地,我们使用已经训练好的的DynaBERTw作为老师模型

    作者: Noah's Ark LAB
    发表时间: 2020-08-27 09:35:06
    3836
    0
  • 【ModelArts】【训练作业】请问ModealArts平台进行训练时是否自动采用混合精度

    【功能模块】【操作步骤&问题现象】在ModelArts平台,利用Acend-910进行训练时,运行时总会出现如下提示:There are 308 node/nodes used reduce precision to selected the kernel!【截图信息】【日志信息】(可选,上传日志内容或者附件)

    作者: yd_290476250
    446
    7
  • 微认证之鲲鹏计算平台软件移植初体验

    鲲鹏计算平台软件移植初体验 鲲鹏代码迁移是当前业界比较热的话题,本课程以PostgreSQL展示了代码迁移的全流程。 章/节 时长(分钟) 学习目标 使用鲲鹏平台的背景及意义 10 了解鲲鹏平台产生的背景和代码迁移的意义 软件迁移原理和迁移过程 19 掌握软件运行的原理和代码迁移的根本原因

    作者: 考过IE励志当攻城狮
    发表时间: 2021-05-04 08:39:25
    4305
    0
  • 训练学习 分享

    本次训练学习,托马斯商城这个项目和DevCloud产品让我对部署程序有帮助。DevOps源于Google、Amazon、Facebook等企业实践,2008年PatrickDebois在“Agile 2008 conference”首次提出DevOps术语,由Filckr展示的

    作者: yd_274882874
    555
    0
  • 人工智能LLM模型:奖励模型的训练、PPO 强化学习训练、RLHF

    然逼真,让大语言模型的生成能力更进一步。 2.PPO 强化学习训练 2.1 PPO 强化学习概念 大语言模型完成奖励模型的训练后,下一个阶段是训练强化学习模型(RL 模型),也是最后一个阶段。大语言模型微调中训练 RL 模型采用的优化算法是 PPO(Proximal Policy

    作者: 汀丶
    发表时间: 2023-07-17 22:24:35
    28
    0
  • 华为ModelArts助力AI开发平台—ModelArts SDK打通本地IDE与云端训练资源

    Arts平台提交训练作业,并持续的获取训练日志直到训练结束。 查看训练过程 ModelArts Training Log 中会展示训练过程中的日志,同时日志也会保存在工程目录下的MA_LOG文件夹。如下图所示,左边是训练任务的状态,右边是云端训练日志的输出,本案例的训练任务需6分钟左右完成。

    作者: 华为云classroom
    发表时间: 2023-12-13 11:16:34
    15
    0
  • 使用Python实现深度学习模型:分布式训练与模型并行化

    引言 随着深度学习模型的复杂度和数据量的增加,单一设备的计算能力往往无法满足训练需求。分布式训练和模型并行化技术可以有效地加速模型训练过程,提高计算效率。本文将介绍如何使用Python实现深度学习模型的分布式训练与模型并行化。 所需工具 Python 3.x TensorFlow

    作者: Echo_Wish
    发表时间: 2024-07-09 08:23:19
    103
    0
  • 【CANN训练营】昇腾AI基础知识介绍

    供运行时资源(例如设备、内存等)管理、模型加载与执行、算子加载与执行、图片数据编解码/裁剪/缩放处理等API库,实现在昇腾CANN平台上进行深度学习推理计算、图形图像预处理、单算子加速计算等能力。简单来说,就是统一的API框架,实现对所有资源的调用。 3.2 AscendCL

    作者: Twilight
    发表时间: 2022-07-17 09:32:41
    1098
    0
  • 《深入理解AutoML和AutoDL:构建自动化机器学习深度学习平台》 —2.3 现有AutoML平台产品

    即可完成整个深度神经网络的构建与训练,同时完成后可以立即部署于谷歌上进入生产环境。3.迁移学习与元学习的运用Cloud AutoML利用了元学习与迁移学习。元学习与迁移学习可以有效利用过去的训练经验与训练数据,这意味着用户不再像过往那样需要提供海量的数据进行模型训练,而只需要提

    作者: 华章计算机
    发表时间: 2019-11-15 15:30:12
    4685
    0
  • 自动驾驶仿真平台

    VIDIA的那篇端到端学习的论文,利用卷积神经网络训练,项目教授了一些工程上的技巧,挑战在于优化神经网络。主要用于教授学生如何使用深度学习训练无人驾驶汽车。   基于GTA ·         DeepDrive 加州大学伯克利DeepDrive深度学习自动驾驶产业联盟是由加州

    作者: AI_Avatars
    发表时间: 2019-12-28 09:53:51
    15358
    0