内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 深度学习之批量算法

    促使我们从小数目样本中获得梯度统计估计动机是训练集冗余。在最坏情况下,训练集中所有的 m 个样本都是彼此相同拷贝。基于采样梯度估计可以使用单个样本计算出正确梯度,而比原来做法少花了 m 倍时间。实践中,我们不太可能真的遇到这种最坏情况,但我们可能会发现大量样本都对

    作者: 小强鼓掌
    317
    1
  • 深度学习之梯度下降

    经网络,但是如果这类无鞍算法能够扩展的话,还是很有希望。除了极小值和鞍点,还存在其他梯度为零点。例如从优化角度看与鞍点很相似的极大值,很多算法不会被吸引到极大值,除了未经修改牛顿法。和极小值一样,许多种类随机函数极大值在高维空间中也是指数级稀少。

    作者: 小强鼓掌
    331
    2
  • 深度学习之参数绑定

    参数添加约束或惩罚时,一直是相对于固定区域或点。例如,L2正则化(或权重衰减)对参数偏离零固定值进行惩罚。然而,有时我们可能需要其他方式来表达我们对模型参数适当值先验知识。有时候,我们可能无法准确地知道应该使用什么样参数,但我们根据领域和模型结构方面的知识得知模型参数之

    作者: 小强鼓掌
    835
    2
  • 深度学习入门》笔记 - 22

    神经网络模型建立好了之后,必然要进行模型评估来了解神经网络表现。 神经网络因变量通常有两种数据类型,定量数据和定性数据。不同因变量数据类型对应模型误差定义也不一样。当因变量为定性数据时,模型误差可以进一步分为两个类型: 假阳性率, FPR False Positive Rate

    作者: 黄生
    38
    3
  • 深度学习入门》笔记 - 25

    L2惩罚法也是一个经典正则化方法。 它是在原有损失函数基础上,在构造一个新损失函数。(带有惩罚项 是一个超参数)模型集成(model ensemble)可以提供模型预测准确度,思想就是, 先训练大量结构不同模型,通过平均、或投票方式综合所有模型结构,得到最终预测。在实际中,有较大限制,原因很简单,

    作者: 黄生
    20
    1
  • 深度学习入门》笔记 - 15

    28/6/1659794617251380299.png) logistic模型找到这条线,预测都正确。 但是,如果不是这么“完美”分布呢,比如这样第2组数据,就不是一条线能泾渭分明分开: ```python #构造第2组数据 def createDataSet_2():

    作者: 黄生
    208
    2
  • 深度学习入门》笔记 - 17

    Propagation FP)算法指输入值通过神经网络得到输出值方法。正向传播算法计算图如下:$sigma$表示sigmoid函数,也就是激活函数。包含损失函数计算图如下:得到$l_2$,通过$l$计算损失函数L,其中$l$表示求解损失函数运算。

    作者: 黄生
    35
    3
  • 深度学习入门》笔记 - 27

    下面用之前广告数据,来建立线性回归模型,看看tensorflow2一般建模过程。import numpy as np #1. 数据预处理:装载广告数据 def loadDataSet(): x=[];y=[] f=open('./Ad.csv')

    作者: 黄生
    22
    2
  • 深度学习入门》笔记 - 28

    keras.models.Sequential()构建模型使用 model.compile() 设置优化方法、损失函数、评价指标 (损失函数值即 训练误差;评价指标的值即 测试误差)使用 model.fit() 带入训练数据,训练模型import tensorflow as tf

    作者: 黄生
    33
    5
  • 深度学习是表示学习经典代表(浅谈什么是深度学习

    目录   先来看机器学习: 什么是特征? 深度学习是表示学习经典代表: 深度学习过程: 深度学习与传统机器学习差别: 深度学习代表算法: 先来看机器学习: 机器学习是利用经验experience来改善 计算机系统自身性能,通过经验获取知识knowledge。 以往都是人们向

    作者: 王博Kings
    发表时间: 2020-12-29 23:39:26
    3406
    0
  • 深度学习之贝叶斯统计

    在有限区间中均匀分布。许多先验偏好于“更简单” 解决方法(如小幅度系数,或是接近常数函数)。        贝叶斯估计通常使用情况下,先验开始是相对均匀分布或高熵高斯分布,观测数据通常会使后验熵下降,并集中在参数几个可能性很高值。

    作者: 小强鼓掌
    720
    4
  • 深度学习——常用评价指标

    曲线下面的面积,通常来说一个越好分类器,AP值越高。  mAP是多个类别AP平均值。这个mean意思是对每个类AP再求平均,得到就是mAP值,mAP大小一定在[0,1]区间,越大越好。该指标是目标检测算法中最重要一个。  在正样本非常少情况下,PR表现效果会更好。  5、

    作者: QGS
    784
    3
  • 深度学习之动量举例

    和粘性阻力呢?部分原因是因为 −v(t) 在数学上便利——速度整数幂很容易处理。然而,其他物理系统具有基于速度其他整数幂其他类型阻力。例如,颗粒通过空气时会受到正比于速度平方湍流阻力,而颗粒沿着地面移动时会受到恒定大小摩擦力。这些选择都不合适。湍流阻力,正比于速度平方,在速度很小时会很弱。

    作者: 小强鼓掌
    420
    2
  • 深度学习之交叉验证

    数据集分成固定训练集和固定测试集后,若测试集误差很小,这将是有问题。一个小规模测试集意味着平均测试误差估计统计不确定性,使得很难判断算法 A 是否比算法 B 在给定任务上做得更好。当数据集有十万计或者更多样本时,这不会是一个严重问题。当数据集太小时,也有替代方法

    作者: 小强鼓掌
    935
    3
  • 深度学习之交叉验证

    将数据集分成固定训练集和固定测试集后,若测试集误差很小,这将是有问题。一个小规模测试集意味着平均测试误差估计统计不确定性,使得很难判断算法 A 是否比算法 B 在给定任务上做得更好。        当数据集有十万计或者更多样本时,这不会是一个严重问题。当数据集太

    作者: 小强鼓掌
    828
    3
  • 深度学习入门》笔记 - 02

    83526687508822.png) 矩阵基本运算就是加减乘除。加减法如果这两个矩阵维度是一样,就非常好理解。矩阵也可以和行向量进行加减,要求行向量列数和矩阵列数是一样。 矩阵乘法,如果两个矩阵维度一样,也非常好理解,这种叫做`逐点相乘`(element-wise

    作者: 黄生
    54
    0
  • 深度学习之计算图

    为了更精确地描述反向传播算法,使用更精确计算图(computational graph)语言是很有帮助。将计算形式化为图形方法有很多。这里,我们使用图中每一个节点来表示一个变量。变量可以是标量、向量、矩阵、张量、或者甚至是另一类型变量。为了形式化我们图形,我们还需引入操作(ope

    作者: 小强鼓掌
    950
    3
  • 如何理解深度学习中损失函数作用呢?

    学习AI之前,就非常好奇深度学习模型怎么就能学习到知识呢?好神奇啊,感觉它跟人一样,给它素材就能学好在学习了一段时间AI理论基础之后,发现深度学习模型学习跟人是不一样,一句话来说,深度学习就是拟合数据过程,给定数据、标签和损失函数(有时也称目标函数),然后根据损失值lo

    作者: 天桥调参师
    5805
    15
  • 深度学习Sigmoid 激活函数

    Sigmoid 函数图像看起来像一个 S 形曲线。

    作者: 我的老天鹅
    422
    4
  • 机器学习算法优缺点(6)-深度学习&支持向量机

    深度学习是人工神经网络最新分支,它受益于当代硬件快速发展。众多研究者目前方向主要集中于构建更大、更复杂神经网络,目前有许多方法正在聚焦半监督学习问题,其中用于训练大数据集只包含很少标记。举例:深玻耳兹曼机(Deep Boltzmann Machine,DBM)Deep

    作者: @Wu
    835
    3