内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 深度学习笔记之理解

            我们今天知道的一些最早的学习算法,是旨在模拟生物学习的计算模型,即大脑怎样学习或为什么能学习的模型。其结果是深度学习以人工神经网络 (artificial neural network, ANN) 之名而淡去。彼时,深度学习模型被认为是受生物大脑(无论人类大脑或其他

    作者: 小强鼓掌
    826
    2
  • 深度学习神经网络

    者目标等),再到更高层的目标、目标的行为等,即底层特征组合成了高层特征,由低到高的特征表示越来越抽象。深度学习借鉴的这个过程就是建模的过程。 深度神经网络可以分为3类,前馈深度网络(feed-forwarddeep networks, FFDN),由多个编码器层叠加而成,如多层感知机(multi-layer

    作者: 运气男孩
    671
    2
  • 深度学习入门》笔记 - 26

    欠拟合、过拟合的总结如下:接下来是TensorFlow框架部分,之前有个帖子 基于TensorFlow 2建立深度学习的模型 - 快速入门 cid:link_0然后会使用它来建立线性回归模型和神经网络分类模型敬请期待

    作者: 黄生
    48
    2
  • 深度学习之经验E

    什么品种,其**有三个不同的品种。        无监督学习算法(unsupervised learning algorithm) 训练含有很多特征的数据集,然后学习出这个数据集上有用的结构性质。在深度学习中,我们通常要学习生成数据集的整个概率分布,显式地,比如密度估计,或是隐式

    作者: 小强鼓掌
    1060
    4
  • 深度学习之正则化

    机器学习中的一个核心问题是设计不仅在训练数据上表现好,并且能在新输入上泛化好的算法。在机器学习中,许多策略显式地被设计为减少测试误差(可能会以增大训练误差为代价)。这些策略被统称为正则化。我们将在后文看到,深度学习工作者可以使用许多不同形式的正则化策略。事实上,开发更有效的正则化

    作者: 小强鼓掌
    527
    0
  • 深度学习随机取样、学习

    4-8096个样本。学习率从梯度下降算法的角度来说,通过选择合适的学习率,可以使梯度下降法得到更好的性能。学习率,即参数到达最优值过程的速度快慢,当你学习率过大,即下降的快,很容易在某一步跨过最优值,当你学习率过小时,长时间无法收敛。因此,学习率直接决定着学习算法的性能表现。可

    作者: 运气男孩
    717
    0
  • 深度学习随机取样、学习

    4-8096个样本。学习率从梯度下降算法的角度来说,通过选择合适的学习率,可以使梯度下降法得到更好的性能。学习率,即参数到达最优值过程的速度快慢,当你学习率过大,即下降的快,很容易在某一步跨过最优值,当你学习率过小时,长时间无法收敛。因此,学习率直接决定着学习算法的性能表现。可

    作者: 运气男孩
    1443
    5
  • 机器学习深度学习的区别是什么?

    深度学习是机器学习算法的子类,其特殊性是有更高的复杂度。因此,深度学习属于机器学习,但它们绝对不是相反的概念。我们将浅层学习称为不是深层的那些机器学习技术。让我们开始将它们放到我们的世界中:这种高度复杂性基于什么?在实践中,深度学习由神经网络中的多个隐藏层组成。我们在《从神经元到

    作者: @Wu
    1169
    3
  • 深度学习之机器学习的挑战

            机器学习的主要挑战是我们的算法必须能够在先前未观测的新输入上表现良好,而不只是在训练集上效果好。在先前未观测到的输入上表现良好的能力被称为泛化(generalization)。通常情况下,当我们训练机器学习模型时,我们可以访问训练集,在训练集上计算一些度量误差,被称为训练误差(training

    作者: 小强鼓掌
    821
    3
  • 深度学习之机器学习的挑战

            机器学习的主要挑战是我们的算法必须能够在先前未观测的新输入上表现良好,而不只是在训练集上效果好。在先前未观测到的输入上表现良好的能力被称为泛化(generalization)。通常情况下,当我们训练机器学习模型时,我们可以访问训练集,在训练集上计算一些度量误差,被称为训练误差(training

    作者: 小强鼓掌
    516
    2
  • 深度学习之经验风险

    机器学习算法的目标是降低式 (8.2) 所示的期望泛化误差。这个数据量被称为风险(risk)。在这里,我们强调该期望取自真实的潜在分布 pdata。如果我们知道了真实分布 pdata(x, y),那么最小化风险变成了一个可以被优化算法解决的优化问题。然而,我们遇到的机器学习问题,通常是不知道

    作者: 小强鼓掌
    627
    2
  • 深度学习之平滑先验

    用于度量测试样本 x 和每个训练样本 x(i) 有多么相似。近年来深度学习的很多推动力源自研究局部模版匹配的局限性,以及深度学习如何克服这些局限性 (Bengio et al., 2006a)。决策树也有平滑学习的局限性,因为它将输入空间分成和叶节点一样多的区间,并在每个区间使用

    作者: 小强鼓掌
    1195
    1
  • 深度学习入门》笔记 - 21

    的梯度消失问题。tanh函数也有梯度消失问题。ReLU(Rectified Linear Unit)函数出现和流行的时间都比较晚,但却是深度学习常用的激活函数。它非常简单: ReLU(x)=max(x,0) 是一个折线函数,所有负的输入值都变换成0,所有非负的输入值,函数值都等于

    作者: 黄生
    28
    1
  • 机器学习深度学习的未来趋势

    机器学习深度学习的未来蕴含着无穷的可能!越来越多的机器人不仅用在制造业,而且在一些其他方面可以改善我们的日常生活方式。医疗行业也可能会发生变化,因为深度学习有助于医生更早地预测或发现癌症,从而挽救生命。在金融领域,机器学习深度学习可以帮助公司甚至个人节省资金,更聪明地投资,更

    作者: @Wu
    1240
    2
  • 深度学习应用开发》学习笔记-13

    Variable来声明来创建变量,它是会变的,在训练中学习到的,所以给它的初值是多少是无所谓的然后就是怎么样来训练模型了训练模型就是一个不断迭代不断改进的过程首先是训练参数,也就是超参,一个是迭代次数train_epochs,这里设置为10,根据复杂情况,可能上万次都可能的。一个是学习率learning_rate,这里默认为0

    作者: 黄生
    456
    0
  • 深度学习之经验E

    learning algorithm) 训练含有很多特征的数据集,然后学习出这个数据集上有用的结构性质。在深度学习中,我们通常要学习生成数据集的整个概率分布,显式地,比如密度估计,或是隐式地,比如合成或去噪。还有一些其他类型的无监督学习任务,例如聚类,将数据集分成相似样本的集合。

    作者: 小强鼓掌
    1164
    3
  • 深度学习训练过程

    一步类似神经网络的随机初始化初值过程,由于第一步不是随机初始化,而是通过学习输入数据的结构得到的,因而这个初值更接近全局最优,从而能够取得更好的效果。所以深度学习的良好效果在很大程度上归功于第一步的特征学习的过程。

    作者: QGS
    1051
    3
  • 浅谈深度学习Backbone

    深度学习中常用的backbone有resnet系列(resnet的各种变体)、NAS网络系列(RegNet)、Mobilenet系列、Darknet系列、HRNet系列、Transformer系列和ConvNeXt。Backbone结构分类主要分成三类:CNNs结构, Trans

    作者: QGS
    81
    2
  • 深度学习框架MindSpore介绍

    了横向联邦学习、纵向联邦学习、联邦迁移学习以及联邦强化学习等方法及对应的框架。端侧推理、迁移学习和联邦学习属于端云协同的不同阶段1 编程简单MindSpore函数式可微分编程架构可以让用户聚焦模型算法数学原生表达。资深的深度学习开发者都体会过手动求解的过程,不仅求导过程复杂,结果

    作者: 运气男孩
    877
    2
  • 深度学习入门》笔记 - 07

    些偏导数等于零,解方程得到b和w的估计值。但是这个方法只适合少数结构比较简单的模型(比如线性回归模型),不能求解深度学习这类复杂模型的参数。 所以下面介绍的是深度学习中常用的优化算法:`梯度下降法`。其中有三个不同的变体:随机梯度下降法、全数据梯度下降法、和批量随机梯度下降法。

    作者: 黄生
    155
    2