已找到以下 10000 条记录
  • 深度学习之临界点

    取得绝对的最小值(相对所有其他值)的点是全局最小点 (globalminimum)。函数可能只有一个全局最小点或存在多个全局最小点,还可能存在不是全局最优的局部极小点。在深度学习的背景下,我们优化的函数可能含有许多不是最优的局部极小点,或许多被非常平坦的区域包围的鞍点。尤其是当输入是多维的时候,所有这些都将使优化变得困难。因此,我们通常寻找

    作者: 小强鼓掌
    1127
    2
  • 深度学习之决策树

    正的决策函数。       正如我们已经看到的,最近邻预测决策树都有很多的局限性。尽管如此,在计算资源受限制时,它们都是很有用的学习算法。通过思考复杂算法 k-最近邻或决策树之间的相似性差异,我们可以建立对更复杂学习算法的直觉。

    作者: 小强鼓掌
    649
    1
  • 深度学习之支持向量机

     支持向量机的一个重要创新是核技巧 (kernel trick)。核策略观察到许多机器学习算法都可以写成样本间点积的形式。例如,支持向量机中的线性函数可以重写为:              其中,x(i) 是训练样本,α 是系数向量。学习算法重写为这种形式允许我们将 x替换为特征函数 φ(x) 的输出,点积替换为被称为核函数

    作者: 小强鼓掌
    956
    4
  • 深度学习笔记之归纳准则

    较大时,Cramér-Rao 下界(Rao, 1945; Cramér, 1946) 表明不存在均方误差低于最大似然学习的一致估计。因为这些原因(一致性统计效率),最大似然通常是机器学习中的首选估计。当样本数目小到会过拟合时,正则化策略如权重衰减可用于获得训练数据有限时方差较小的最大似然有偏版本。

    作者: 小强鼓掌
    931
    3
  • 深度学习中的Attention机制

    当注意到某个目标或某个场景时,该目标内部一级该场景内每一处空间位置上的注意力分布式不一样的。类比:当试图描述一件事情,当前时刻说到的单词句子正在描述的该事情的对应某个片段最相关,其他部分随着描述的进行,相关性也在不断地改变。从Attention的作用角度出发,可分为空间注意力

    作者: 玉箫然
    1035
    0
  • 《MXNet深度学习实战》

    魏凯峰 著PREFACE前  言为什么要写这本书深度学习领域开始受到越来越多的关注,各大深度学习框架也孕育而生,在这个阶段,我被深度学习深深吸引并逐渐开始学习相关知识。研究生毕业后,我继续从事算法相关的工作,具体而言是深度学习算法在图像领域的应用,也就是常说的计算机视觉算法。MXNetPyTorch这两个

    作者: 华章计算机
    发表时间: 2019-06-16 16:07:19
    3924
    0
  • 为什么说深度学习加强化学习就等于AI呢?

    为什么说深度学习+强化学习=AI?这个如何理解

    作者: 建赟
    638
    1
  • 深度学习之语音识别

    我们必须要小心,不能使用会改变类别的转换。例如,光学字符识别任务需要认识到 “b’’ “d’’ 以及 “6’’ “9’’ 的区别,所以对这些任务来说,水平翻转旋转180◦ 并不是合适的数据集增强方式。能保持我们希望的分类不变,但不容易执行的转换也是存在的。例如,平面外绕

    作者: 小强鼓掌
    831
    4
  • 深度学习之Dropout优点

    不出意外的话,使用Dropout时最佳验证集的误差会低很多,但这是以更大的模型更多训练算法的迭代次数为代价换来的。对于非常大的数据集,正则化带来的泛化误差减少得很小。在这些情况下,使用Dropout更大模型的计算代价可能超过正则化带来的好处。只有极少的训练样本可用时,Dropout不会很有效。在只有不到

    作者: 小强鼓掌
    966
    4
  • 网站搭建与部署知识课程

    CCE助力网站搭建,体验容器为企业应用带来的巨大便利 华为云学院推荐 华为云官方学习平台,提供一站式在线学习、实验、考试、认证,零基础也可轻松上云 立即学习 热门课程/实验推荐 弹性云服务器ECS:轻松上云第一步 弹性云服务器概念、操作、应用场景知识一手掌握 【¥0】立即学习 30分钟轻松搭建网站应用 利用华为云服务搭建属于自己的WordPress网站

  • 深度学习之决策树

    的子区域(通常使用坐标轴拆分区域)。空间由此细分成不重叠的区域,叶节点输入区域之间形成一一对应的关系。每个叶结点将其输入区域的每个点映射到相同的输出。决策树通常有特定的训练算法,超出了本书的范围。如果允许学习任意大小的决策树,那么可以被视作非参数算法。然而实践中通常有大小限制作

    作者: 小强鼓掌
    635
    1
  • 深度学习中多层复合函数

    从数学上来看,深度神经网络仅仅是一种函数的表达形式,是复杂的多层复合函数。由于它有大量的可调参数,而且近年来随着大数据、优化算法并行计算GPU硬件的发展,使得用大规模的神经网络来逼近拟合大数据成为可能。

    作者: 我的老天鹅
    875
    22
  • 学习笔记 - 深度学习理论最新进展研究

    下:深度学习通常被描述为一个实验驱动的领域,并且不断被指责缺乏相应的理论基础。这个问题已被目前大量尚未整理好的文献部分地解决。本文回顾整理了深度学习理论的最新进展。这些理论文献被分为六类:(1)分析深度学习泛化的复杂性能力的方法;(2)用于建模随机梯度下降及其变量的随机微分方

    作者: RabbitCloud
    959
    3
  • 深度学习中的池化技术

    池化是一个几乎所有做深度学习的人都了解的一个技术,大家对池化如何进行前向传播也都了解,池化的作用也了解一二。然而,池化如何回传梯度呢,池化回传梯度的原则是什么呢,最大池化与平均池化的区别是什么呢,什么时候选择最大池化、什么时候选择平均池化呢。主要用的池化操作有平均池化、最大池化、

    作者: yyy7124
    935
    2
  • 深度学习笔记》二

    旨在为机器学习算法提供一个常见的基准测试。 MNIST数据集包含手写数字的图像,它是一个非常流行的数据集,被广泛用于图像识别深度学习的模型评估。该数据集共有60,000个训练图像10,000个测试图像,每个图像都是28x28像素的灰度图像。这个数据集已经成为深度学习领域中的一

    作者: 黄生
    发表时间: 2023-08-27 19:55:43
    28
    0
  • 深度学习-语义数据集

    常见的语义分割算法属于有监督学习,因此标注好的数据集必不可少。公开的语义分割数据集有很多,目前学术界主要有三个benchmark(数据集)用于模型训练测试。第一个常用的数据集是Pascal VOC系列。这个系列中目前较流行的是VOC2012,Pascal Context等类似的

    作者: @Wu
    729
    0
  • 深度学习之鞍点激增

    非常小。另一方面,实验中梯度下降似乎可以在许多情况下逃离鞍点。Goodfellow et al. (2015) 可视化了最新神经网络的几个学习轨迹,给了一个例子。这些可视化显示,在突出的鞍点附近,代价函数都是平坦的,权重都为零。但是他们也展示了梯度下降轨迹能够迅速逸出该区间。Goodfellow

    作者: 小强鼓掌
    424
    2
  • 深度学习笔记之约束优化

    Lagrange function) 的新函数。        为了定义Lagrangian,我们先要通过等式不等式的形式描述 S。我们希望通过 m 个函数 g(i) n 个函数 h(j) 描述 S,那么 S 可以表示为 S = {x | ∀i, g(i)(x) = 0 and

    作者: 小强鼓掌
    1160
    3
  • 深度强化学习入门介绍

    试自己的强化学习程序。在本课程中,您将通过使用 Tensorflow PyTorch 来训练能玩太空入侵者、Minecraft、星际争霸、刺猬索尼克等游戏的聪明的智能体。在第一章中,您将学习深度强化学习的基础知识。在训练深度强化学习智能体之前,掌握这些深度学习的基础知识非常重要。让我们开始吧!一

    作者: 可爱又积极
    1187
    1
  • 深度学习之提前终止作用

    对总训练时间的影响不大。提前终止是一种非常不显眼的正则化形式,它几乎不需要改变基本训练过程、目标函数或一组允许的参数值。这意味着,无需破坏学习动态就能很容易地使用提前终止。相对于权重衰减,必须小心不能使用太多的权重衰减,以防网络陷入不良局部极小点(对应于病态的小权重)。提前终止可

    作者: 小强鼓掌
    621
    1