已找到以下 10000 条记录
  • 深度学习之Bagging学习

    回想一下Bagging学习,我们定义 k 个不同的模型,从训练集有替换采样构造k 个不同的数据集,然后在训练集 i 上训练模型 i。Dropout的目标是在指数级数量的神经网络上近似这个过程。具体来说,在训练中使用Dropout时,我们会使用基于小批量的学习算法和较小的步长,如梯

    作者: 小强鼓掌
    1254
    2
  • 分享优秀 AI 论文——收敛一致性可能解释不了深度学习中的泛化现象

    explain generalization in deep learning收敛一致性可能解释不了深度学习中的泛化现象推荐理由:为了探究深度学习泛化能力背后的原理,学术界提出了泛化边界的概念,然后尝试用「收敛一致性」理论推导、设计出了各种各样的泛化边界描述方法,似乎已经取得了不少成

    作者: 初学者7000
    1268
    2
  • 深度学习进阶篇-预训练模型1:预训练分词Subword、ELMo、Transformer模型原理;结构;技巧以及应用详解

    深度学习进阶篇-预训练模型[1]:预训练分词Subword、ELMo、Transformer模型原理;结构;技巧以及应用详解 从字面上看,预训练模型(pre-training model)是先通过一批语料进行训练模型,然后在这个初步训练好的模型基础上,再继续训练或者另作他用。这

    作者: 汀丶
    发表时间: 2023-05-24 10:42:54
    9
    0
  • 深度学习是什么?

    学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。深度学习在搜索技术,数据挖掘,机器学习

    作者: QGS
    822
    2
  • 深度学习算法优化油田水处理过程

    深度学习算法优化油田水处理过程 油田水处理是在石油开采过程中至关重要的一环。传统的处理方法往往依赖于经验和规则,但这些方法可能无法处理复杂的水质变化和高水量的情况。利用深度学习算法,我们可以通过对大量数据的学习和模式识别来优化油田水处理过程,提高效率和水质。 数据收集与准备

    作者: 皮牙子抓饭
    发表时间: 2023-06-30 19:10:04
    5
    0
  • 横向联邦训练作业对接MA - 可信智能计算服务 TICS

    创建可信联邦学习训练型作业 参考步骤创建横向训练型作业创建可信联邦学习训练型作业,运行环境选择ModelArts和PriorityModelArts时,新增的资源配额是使用MA Lite资源池进行训练时,工作负载需要配置的资源参数。 图2 配置参数 父主题: 可信联邦学习作业

  • 深度学习之推断

    在Bagging的情况下,每一个模型在其相应训练集上训练收敛。在Dropout的情况下,通常大部分模型都没有显式地被训练,因为通常父神经网络会很大,以致于到宇宙毁灭都不可能采样完所有的子网络。取而代之的是,在单个步骤中我们训练一小部分的子网络,参数共享会使得剩余的子网络也能有好

    作者: 小强鼓掌
    426
    4
  • 初识 torch.Autograd | 理解pytorch网络训练过程 | 笔记

    是我们在训练过程中想要最小化的损失函数。 为了计算损失,我们使用给定数据样本的输入进行预测,并将其与真实数据标签值进行比较。 Optimizer 【 优化器】 优化是在每个训练步骤中调整模型参数以减少模型误差的过程。 优化算法定义了这个过程如何执行的(在这个例子中我们使用随机梯度下降)。

    作者: 墨理学AI
    发表时间: 2022-01-11 14:27:36
    602
    0
  • 深度学习应用开发》学习笔记-13

    值是多少是无所谓的然后就是怎么样来训练模型了训练模型就是一个不断迭代不断改进的过程首先是训练参数,也就是超参,一个是迭代次数train_epochs,这里设置为10,根据复杂情况,可能上万次都可能的。一个是学习率learning_rate,这里默认为0.05下一步定义损失函数,用

    作者: 黄生
    457
    0
  • MindSpore-LeNet模型理解深度学习一般化过程

    果数据的输出。3)深度学习的两个关键过程“模型训练”和“模型推理”    深度学习学习就体现在学习数据、训练模型上面,通过海量的数据输入结合特定的网络模型来进行训练学习,最终输出具备一定精准度的模型文件,供后续推理使用。模型训练    在人工智能的深度学习方面,模型是核心,其

    作者: 多米诺的古牌
    424
    0
  • Ascend平台训练efficientNet出现警告且网络不收敛

    0网络均可以收敛,精度可以达到94%以上在同样的网络,同样的参数配置下,在Ascend上面会报警告,同时loss一直在2.3,也就是log10,精度也是10%,也就是说网络是无效的,调整学习率以及网络权重初始化方式均无效【截图信息】同样的参数,在其他硬件平台都可以收敛,但Asce

    作者: 成电杨漂亮
    2278
    5
  • 机器学习13-训练模型的坑

    很多常见情况会导致反向传播算法出错。 梯度消失 较低层(更接近输入)的梯度可能会变得非常小。在深度网络中,计算这些梯度时,可能涉及许多小项的乘积。 当较低层的梯度逐渐消失到0时,这些层的训练速度会非常缓慢,甚至不再训练。 策略:ReLU激活函数有助于防止梯度消失。 梯度爆炸 如果网络中的权重过

    作者: 一颗小树x
    发表时间: 2021-06-18 13:50:01
    2040
    0
  • 深度学习

    全面地讲述深度学习的历史超出了本书的范围。然而,一些基本的背景对理解深度学习是有用的,深度学习经历了三次发展浪潮:20世纪40年代到60年代深度学习的雏形出现在控制论(cybernetics)中,20世纪80年代到90年代深度学习表现为联结主义(connectionism),直到

    作者: QGS
    965
    4
  • 基于深度学习的石油炼化过程优化

    石油炼化行业是一个复杂而庞大的产业,石油炼化过程中的优化问题一直是石油炼化企业关注的重点。传统的优化方法往往依赖于经验和规则,有限的人工干预和复杂的生产环境限制了优化效果。然而,随着深度学习技术的快速发展,基于深度学习的石油炼化过程优化成为了一种新的解决方案。本文将探索基于深度学习的石油炼化过程优化,并提供一个具体的应用场景。

    作者: 皮牙子抓饭
    发表时间: 2023-06-30 22:13:11
    4
    0
  • 学习笔记|EM算法的收敛

    很自然地要问:EM算法得到的估计序列是否收敛?如果收敛,是否收敛到全局最大值或局部极大值?下面给出关于EM算法收敛性的两个定理。 证明: 由于 取对数有 (可参见学习笔记|EM算法介绍及EM算法的导出及其在无监督学习中的应用) 令 于是对数似然函数可以写成

    作者: darkpard
    发表时间: 2021-12-22 12:03:25
    853
    0
  • BERT的预训练与微调:深度解析

    from Transformers)以来,这个深度学习模型迅速成为自然语言处理(NLP)领域的核心工具。BERT模型通过双向编码器表示和预训练任务,显著提升了文本理解能力。本文将深入解析BERT的预训练与微调过程,并通过实例与代码展示如何在实际项目中应用BERT。 I. BERT的发展历程

    作者: Y-StarryDreamer
    发表时间: 2024-08-09 11:22:13
    109
    0
  • Python机器学习训练Tesseract

    文件来保证你有足够的训练数据。因为 Tesseract 会忽略那 些不能读取的文件,所以建议你尽量多做一些矩形定位文件,以保证训练足够充分。如果 你觉得训练的 OCR 结果没有达到你的目标,或者 Tesseract 识别某些字符时总是出错,多 创建一些训练数据然后重新训练将是一个不错的改进方法。

    作者: Lansonli
    发表时间: 2021-09-28 15:08:31
    1483
    0
  • 如何在模型训练时,设置日志级别? - 网络智能体

    如何在模型训练时,设置日志级别? 在TensorFlow的log日志等级如下: - 0:显示所有日志(默认等级) - 1:显示info、warning和error日志 - 2:显示warning和error信息 - 3:显示error日志信息 以设置日志级别为“3”为例,操作方法如下:

  • 训练过程中无法找到so文件 - AI开发平台ModelArts

    编译生成so文件的cuda版本与训练作业的cuda版本不一致。 处理方法 编译环境的cuda版本与训练环境不一致,训练作业运行就会报错。例如:使用cuda版本为10的开发环境tf-1.13中编译生成的so包,在cuda版本为9.0训练环境中tf-1.12训练会报该错。 编译环境和训练环境的cuda版本不一致时,可参考如下处理方法:

  • 浅谈深度学习

    制等。工作原 理深度学习的工作原理如下:首先,它会收集大量数据,并将其存储在训练集中。然后,深度学习模型会对训练集中的数据进行特征提取,以便更好地适应不同的数据类型。最后,深度学习模型会根据训练集的数据特征,对新的数据进行分类或预测。应用在图像识别领域,深度学习技术可以自动识别图

    作者: 运气男孩
    24
    3