内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 深度学习训练过程

    上升的非监督学习就是从底层开始,一层一层地往顶层训练。采用无标定数据(有标定数据也可)分层训练各层参数,这一步可以看作是一个无监督训练过程,这也是和传统神经网络区别最大的部分,可以看作是特征学习过程。具体的,先用无标定数据训练第一层,训练时先学习第一层的参数,这层可以看作是得到一

    作者: QGS
    539
    1
  • 深度学习之虚拟对抗

    由于它们被限制为线性而无法抵抗对抗样本。神经网络能够将函数从接近线性转化为局部近似恒定,从而可以灵活地捕获到训练数据中的线性趋势同时学习抵抗局部扰动。对抗样本也提供了一种实现半监督学习的方法。在与数据集中的标签不相关联的点 x 处,模型本身为其分配一些标签 yˆ。模型的标记 yˆ

    作者: 小强鼓掌
    679
    1
  • 12本深度学习书籍推荐:有入门,有深度

    框架介绍深度学习。本书的一大优点是作者可读性非常强。人工智能和深度学习中的复杂概念被简单地阐述出来,使得读者很容易理解。作者也避免了数学符号,而是通过 30 多个代码片段来解释概念。通过本书,你将从头开始学习深度学习学习图像分类模型,学习如何在文本和序列数据上使用深度学习技术,如

    作者: 开发者学堂小助
    发表时间: 2018-04-09 09:59:59
    14046
    0
  • 深度学习之对抗样本

    具有许多输入,那么它的值可以非常迅速地改变。如果我们用 ϵ 改变每个输入,那么权重为w 的线性函数可以改变 ϵ ∥w∥1 之多,如果 w 是高维的这会是一个非常大的数。对抗训练通过鼓励网络在训练数据附近的局部区域恒定来限制这一高度敏感的局部线性行为。这可以被看作是一种明确地向监督

    作者: 小强鼓掌
    631
    3
  • 深度学习之Dropout启发

    须选择让神经网络能够学习对抗的修改类型。在理想情况下,我们也应该使用可以快速近似推断的模型族。我们可以认为由向量 µ 参数化的任何形式的修改,是对 µ 所有可能的值训练 p(y | x, µ) 的集成。注意,这里不要求 µ 具有有限数量的值。例如, µ 可以是实值。Srivastava

    作者: 小强鼓掌
    547
    1
  • 深度学习之maxout 单元

    ik}。这提供了一种方法来学习对输入 x 空间中多个方向响应的分段线性函数。maxout 单元可以学习具有多达 k 段的分段线性的凸函数。maxout 单元因此可以视为学习激活函数本身而不仅仅是单元之间的关系。使用足够大的 k,maxout 单元可以以任意的精确度来近似任何凸函数。特别地,具有两块的

    作者: 小强鼓掌
    1104
    1
  • 深度学习和层级结构

    语言有着层级结构,大的结构部件是由小部件递归构成的。但是,当前大多数基于深度学习的语言模型都将句子视为词的序列。在遇到陌生的句子结构时,循环神经网络(RNN)无法系统地展示、扩展句子的递归结构,深度学习学到的各组特征之间的关联是平面的,没有层级关系,那么请问层级关系是重要吗,在哪些方面能够体现

    作者: 初学者7000
    634
    1
  • 深度学习之噪声鲁棒性

    项技术主要用于循环神经网络 (Jim et al., 1996; Graves, 2011)。这可以被解释为关于权重的贝叶斯推断的随机实现。贝叶斯学习过程将权重视为不确定的,并且可以通过概率分布表示这种不确定性。向权重添加噪声是反映这种不确定性的一种实用的随机方法。

    作者: 小强鼓掌
    638
    1
  • 深度学习笔记之KL散度

    负对数似然组成的损失都是定义在训练集上的经验分布和定义在模型上的概率分布之间的交叉熵。例如,均方误差是经验分布和高斯模型之间的交叉熵。我们可以将最大似然看作是使模型分布尽可能和经验分布 pˆdata 相匹配的尝试。理想情况下,我们希望匹配真实的数据生成分布 pdata,但我们没法直接知道这个分布。虽然最优

    作者: 小强鼓掌
    1206
    1
  • 深度学习之提前终止

    循环次数内没有进一步改善时,算法就会终止。此过程在算法中有更正式的说明。这种策略被称为提前终止(early stopping)。这可能是深度学习中最常用的正则化形式。它的流行主要是因为有效性和简单性。

    作者: 小强鼓掌
    325
    0
  • 深度学习之模板匹配

    非常相似。该模型进而会赋予相对应的训练标签 y 较大的权重。总的来说,预测将会组合很多这种通过训练样本相似性加权的训练标签。支持向量机不是唯一可以使用核策略来增强的算法。许多其他的线性模型可以通过这种方式来增强。使用核策略的算法类别被称为核机器 (kernel machine) 或核方法 (kernel method)(Williams

    作者: 小强鼓掌
    464
    1
  • 深度学习之任务 T

     在相对正式的 “任务”定义中,学习过程本身并不是任务。学习是我们所谓的获取完成任务的能力。例如,我们的目标是使机器人能够行走,那么行走便是任务。我们可以编程让机器人学会如何行走,或者可以编写特定的指令,人工指导机器人如何行走。        通常机器学习任务定义为机器学习系统该如何处理样本

    作者: 小强鼓掌
    727
    2
  • AI前沿——深度学习技术

    算法,人类终于找到了如何处理“抽象概念”这个亘古难题的方法。机器学习(Machine Learning)是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构市值不断改善自身的性能的学科,简单地说,机器学习就是通过算法,使得机器能从大量的历史数据中学习规律,从而对新的样本做智能

    作者: 运气男孩
    431
    2
  • 深度学习之贝叶斯统计

    是未知的定值,而点估计θˆ 是考虑数据集上函数(可以看作是随机的)的随机变量。        贝叶斯统计的视角完全不同。贝叶斯用概率反映知识状态的确定性程度。数据集能够直接观测到,因此不是随机的。另一方面,真实参数 θ 是未知或不确定的,因此可以表示成随机变量。        在观察到数据前,我们将

    作者: 小强鼓掌
    619
    1
  • 深度学习之历史小计

    1847)。从 20 世纪 40 年代开始,这些函数近似技术被用于导出诸如感知机的机器学习模型。然而,最早的模型都是基于线性模型。来自包括 Marvin Minsky 的批评指出了线性模型族的几个缺陷,例如它无法学习 XOR 函数,这导致了对整个神经网络方法的抵制。

    作者: 小强鼓掌
    414
    0
  • 浅谈深度学习模型压缩

    teacher-student模型是迁移学习的一种,迁移学习也就是将一个模型的性能迁移到另一个模型上,对于教师网络往往是一个更加复杂的网络,具有非常好的性能和泛化能力,可以用这个网络来作为一个soft target来指导另外一个更加简单的学生网络来学习,使得更加简单、参数运算量更少的学

    作者: QGS
    37
    1
  • 深度学习典型模型

    型的深度学习模型有卷积神经网络( convolutional neural network)、DBN和堆栈自编码网络(stacked auto-encoder network)模型等,下面对这些模型进行描述。 卷积神经网络模型 在无监督预训练出现之前,训练深度神经网络通常非常困难

    作者: 某地瓜
    1673
    1
  • 深度学习之正切传播

    正交,这个正则化项当然可以通过适当的超参数缩放,并且对于大多数神经网络,我们需要对许多输出求和 (此处为描述简单,f(x) 为唯一输出)。与切面距离算法一样,我们根据切向量推导先验,通常从变换(如平移、旋转和缩放图像)的效果获得形式知识。正切传播不仅用于监督学习(Simard et

    作者: 小强鼓掌
    345
    1
  • 浅谈深度学习常用术语

    深度学习常用术语· 样本(sample)或输入(input)或数据点(data point):训练集中特定的实例。我们在上一章中看到的图像分类问题,每个图像都可以被称为样本、输入或数据点。· 预测(prediction)或输出(output):由算法生成的值称为输出。例如,在先前

    作者: QGS
    22
    0
  • 深度学习模型轻量化

    硬件层加速。这个维度主要在AI硬件芯片层,目前有GPU、FPGA、ASIC等多种方案,各种TPU、NPU就是ASIC这种方案,通过专门为深度学习进行芯片定制,大大加速模型运行速度。

    作者: 可爱又积极
    1259
    4