已找到以下 10000 条记录
  • 深度学习简介

    本课程由台湾大学李宏毅教授2022年开发的课程,主要介绍机器学习基本概念简介、深度学习基本概念简介。

  • 深度学习入门》笔记 - 07

    些偏导数等于零,解方程得到b和w的估计值。但是这个方法只适合少数结构比较简单的模型(比如线性回归模型),不能求解深度学习这类复杂模型的参数。 所以下面介绍的是深度学习中常用的优化算法:`梯度下降法`。其中有三个不同的变体:随机梯度下降法、全数据梯度下降法、和批量随机梯度下降法。

    作者: 黄生
    156
    2
  • 深度学习GRU

    Gated Recurrent Unit – GRU 是 LSTM 的一个变体。他保留了 LSTM 划重点,遗忘不重要信息的特点,在long-term 传播的时候也不会被丢失。

    作者: 我的老天鹅
    1264
    13
  • 深度学习应用开发》学习笔记-23

    从人的角度来看,12个特征比1个特征要复杂了很多, 但对计算机来说,无所谓。 在tf里,12元的线性回归方程的实现,比1元的线性方程的实现,代码上也只是多了一点点复杂度而已。 这就是计算机的优势。 只是最后训练的结果,为什么都是nan,像老师说的,脸都黑了哦~ 这次先到这里,请听下回分解~

    作者: 黄生
    1471
    4
  • 深度学习应用开发》学习笔记-20

    落了很长时间没学,捡起来继续。编号也忘了从哪里接上,就从20开始吧。 前面弄完了一元线性回归,现在是波士顿房价预测-多元线性回归。 数据方面,12+1共13个指标,506行数据。 前面12个是多个维度的数据,维度还是比较全面的,是输入值/特征。 比如:城镇人均犯罪率、师生比例、住宅比例、边界是否为河流等

    作者: 黄生
    934
    3
  • 深度学习应用开发》学习笔记-30

    终于进了一步,看到了MNIST手写数字识别,使用一个神经元。 MNIST数据集来自于NIST 美国国家标准和技术研究所。 找学生和工作人员手写的。 规模:训练集55000,验证集5000,测试集10000。大小约10M。 数据集可以在网站上去下载,同时tf自己里面已经集成了这个数据集。

    作者: 黄生
    527
    0
  • 深度学习应用开发》学习笔记-28

    这个房价预测的例子基本就结束了,下面是用TensorBoard来将算法,和模型训练过程的一些信息进行可视化。可视化是一件有意见的工作,有助于信息的理解和推广。可视化在modelarts的老版的训练作业下,是收费的,但这个服务在新版的训练作业里已经没有了,也行是因为这个可视化服务的

    作者: 黄生
    838
    3
  • 深度学习入门》笔记 - 12

    学习步长$\alpha$是一个很重要的参数。 如果太小,算法会收敛的很慢。 如果太大,容易造成算法不收敛,甚至发散。 自变量的标准化,和因变量的中心化,是建立深度学习模型常用的数据预处理方法。 他们的好处,是不仅可以让梯度下降法的数值表现的更加稳定,还有助于我们找到合适的初始值和步长。

    作者: 黄生
    278
    1
  • 深度学习入门》笔记 - 01

    之前学了一个深度学习应用开发,学了一段时间,后来就没学了。 确实是"靡不有初,鲜克有终",现在不愿意再继续之前的学。我又找了一本书从头开始,这本书的名字是深度学习入门与TensorFlow实践>。 `数(scalar)`是一个数字。 简直是废话。 不过这才刚开始嘛。 多个数字有序

    作者: 黄生
    283
    1
  • 深度学习应用开发》学习笔记-25

    那怎么做归一化呢,方法比较简单,就是 (特征值 - 特征值最小者)/(特征值最大值 - 特征值最小者) 这样归一化后的值,范围在 [0,1]之间。 标签值是不需要做归一化的哦 放一下有修改的代码,以及训练的结果: ```python #做归一化,对列index是0到11的特征值做归一化

    作者: 黄生
    857
    3
  • 深度学习应用开发》学习笔记-14

    这里用的损失函数是采用均方差(Mean Square Error MES),还有一个是交叉熵(cross-entropy)这个tf都提供了方法,这样写:loss_function=tf.reduce_mean(tf.squre(y-pred))这里pred是一个节点,就是调用模型

    作者: 黄生
    626
    2
  • 深度学习应用开发》学习笔记-08

    从清华镜像下载python3的anaconda,然后安装anaconda,安装后,会用到他的prompt和jupyter notebook. 然后设置anaconda的源为清华镜像,安装tensorflow。可安装不带gpu的。教学够用了。这里版本是1.2. 安装好之后,做一个简

    作者: 黄生
    1134
    3
  • 深度学习应用开发》学习笔记-29

    房价的tf2版本,有一些变化。 1是直接使用sklearn.preprocessing里的scale来做归一化,更简单便捷 2不是一股脑将数据全用于训练,划分了分别用于训练、验证、测试的数据 3损失函数,优化器方面,代码有变化,头疼~ 4对训练数据没有做打散的操作 代码如下: 最

    作者: 黄生
    769
    3
  • 深度学习入门》笔记 - 05

    接下来就是讲线性模型了。线性模型相对比较简单,但是他是学习比较复杂的深度学习模型的一个基础,而且线性模型本身也具有广泛的用途。 这里讲了线性模型中的线性回归模型和logistic模型。线性回归模型用于处理`回归问题`。logistic模型用于处理`分类问题`。 线性回归模型可以写作如下的形式:

    作者: 黄生
    145
    3
  • 机器学习深度学习区别

    深度学习由经典机器学习发展而来,两者有着相同与不同特点1.完全不同的模式机器学习:使计算机能从数据中学习,并利用其学到的知识来提供答案(通常为预测)。依赖于不同的范式(paradigms),例如统计分析、寻找数据相似性、使用逻辑等深度学习:使用单一技术,最小化人脑劳动。使用被称为

    作者: 极客潇
    1358
    4
  • 深度学习深度前馈网络

           深度前馈网络 (deep feedforward network),也叫作前馈神经网络 (feedforward neural network) 或者多层感知机 (multilayer perceptron, MLP),是典型的深度学习模型。前馈网络的目标是近似某个函数

    作者: 小强鼓掌
    1257
    4
  • 深度学习入门》笔记 - 18

    网络的目的是建立输入层与输出层之间的关系,进而利用建立的关系得到预测值。通过增加隐藏层,神经网络可以找到输入层与输出层之间较复杂的关系。深度学习是拥有多个隐藏层的神经网络,在神经网络中,我们通过正向传播算法得到预测值,并通过反向传播算法得到参数梯度,然后利用梯度下降法更新参数,使

    作者: 黄生
    23
    1
  • 深度学习入门》笔记 - 16

    层,这种关系无法表达。同时可以通过增加隐藏层的数量和每个隐藏层的节点数,来处理更加复杂的问题。拥有多个隐藏层的神经网络就可以实现深度学习。而数量越多,就需要更多的技巧来训练并发挥这些隐藏层的作用。

    作者: 黄生
    37
    4
  • PyTorch深度学习实战 | 深度学习框架(PyTorch)

    640.png 1、PyTorch简介 2017年1月,Facebook人工智能研究院(FAIR)团队在GitHub上开源了PyTorch,并迅速占领GitHub热度榜榜首。 作为具有先进设计理念的框架,PyTorch的历史可追溯到Torch。Torch于2002年诞生于纽约大学

    作者: TiAmoZhang
    发表时间: 2023-03-16 07:53:51
    749
    0
  • 深度学习之多任务学习

    地泛化。展示了多任务学习中非常普遍的一种形式,其中不同的监督任务(给定 x预测 y(i))共享相同的输入 x 以及一些中间层表示 h(share),能学习共同的因素池。该模型通常可以分为两类相关的参数:多任务学习深度学习框架中可以以多种方式进行,该图说明了任务共享相同输入但涉及

    作者: 小强鼓掌
    532
    1