内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 深度学习Attention机制

    Attention,即Attention输出向量分布是一种one-hot独热分布或是soft软分布,直接影响上下文信息选择。加入Attention原因:1、当输入序列非常长时,模型难以学到合理向量表示2、序列输入时,随着序列不断增长,原始根据时间步方式表现越来越差,由于原始时间步模型设计结构有缺

    作者: 玉箫然
    1035
    0
  • 深度学习应用开发》学习笔记-04

    在1904年时候,生物学家了解了神经元结构然后在1945年时候发明了神经元模型。那么这个神经元模型真的可以模拟生物神经功能吗,个人觉得有点奇妙,不过动物植物本来都是很奇妙存在。所谓全连接层,就是说某层一个节点,和他上一层所有节点都有连接。就像连接边长不同,每条

    作者: 黄生
    729
    3
  • 深度学习应用开发》学习笔记-24

    上一节训练不出结果,都是nan原因找到了,就是因为特征数据没有做归一化,那归一化是个什么概念呢?这里有一个很好例子,做一道菜,准备好材料鸭、笋、....盐、酱油...水,再加上烹饪火候,可以做出一道菜。上面做菜每一个要素,都可以看做一个特征变量,而重量可以看做是特征变量值,比如鸭肉xxg

    作者: 黄生
    615
    1
  • 深度学习应用开发》学习笔记-27

    可视化还是比较重要,因为数据能在图形上看到,会更直观,更符合人认知思维。 这里先来展示一下loss可视化。 用matplot将列表值画出来,调用非常简单 plt.plot(loss_list) 横坐标是列表中索引,纵坐标是列表值,也就是loss值。 可以看到,曲线在收敛了

    作者: 黄生
    827
    2
  • 深度学习应用开发》学习笔记-32

    这里谈到了独热编码one-hot,独热编码是用来表示标签数据。前面已经知道了,标签数据很简单,就是表示0-9范围内一个数字。 说实话独热编码有什么用处,真的还没有理解。还有什么欧式空间概念啊,都很陌生。 看看代码吧。 ```python #独热编码示例。 x=[3,4] tf

    作者: 黄生
    1141
    3
  • 深度学习之PCA

    PCA这种将数据变换为元素之间彼此不相关表示能力是PCA一个重要性质。它是消除数据中未知变动因素简单表示实例。在PCA中,这个消除是通过寻找输入空间一个旋转(由 W 确定),使得方差主坐标和 z 相关新表示空间基对齐。虽然相关性是数据元素间依赖关系一个重要范畴,但我们对于能够消

    作者: 小强鼓掌
    541
    1
  • 【转载】传统机器学习深度学习

    作者: andyleung
    1036
    5
  • 深度学习之优化理论限制

    经网络单元输出光滑连续值,使得局部搜索求解优化可行。一些理论结果表明,存在某类问题是不可解,但很难判断一个特定问题是否属于该类。其他结果表明,寻找给定规模网络一个可行解是很困难,但在实际情况中,我们通过设置更多参数,使用更大网络,能轻松找到可接受解。此外,在神经网络

    作者: 小强鼓掌
    428
    2
  • 深度学习简介

    本课程由台湾大学李宏毅教授2022年开发课程,主要介绍机器学习基本概念简介、深度学习基本概念简介。

  • 适合新手深度学习综述(6)--深度生成模型

    Models),在这些模型中,他们扩展了具有辅助变量深层生成模型。辅助变量利用随机层和跳过连接生成变分分布。Rezende 等人 (2016) 开发了一种深度生成模型单次泛化。6.1 玻尔兹曼机玻尔兹曼机是学习任意概率分布连接主义方法,使用最大似然原则进行学习。6.2 受限玻尔兹曼机受限玻尔兹曼机

    作者: @Wu
    155
    1
  • 深度学习之平滑先验

    务中统计挑战。本书中,我们将介绍深度学习如何引入额外(显示和隐式)先验去降低复杂任务中泛化误差。这里,我们解释为什么单是平滑先验不足以应对这类任务。有许多不同方法来隐式地或显式地表示学习函数应该是光滑或局部不变先验。所有这些不同方法都旨在鼓励学习过程能够学习出函数

    作者: 小强鼓掌
    1195
    1
  • 深度学习应用开发》学习笔记-21

    说道:矩阵运算,是机器学习基本手段,必须要掌握。 所以后面有线性代数、矩阵运算基本介绍。 标量是一个特殊向量(行向量、列向量),向量是一个特殊矩阵;这样说来,标量,也是一个特殊矩阵,一行一列矩阵。 看代码吧 ```python import numpy as np ```

    作者: 黄生
    1038
    2
  • 深度学习-语义分割

    而,我们可以轻松地通过重叠方式观察到每个目标。argmax方式也很好理解。如上图所示,每个通道只有0或1,以Person通道为例,红色1表示为Person像素,其他像素均为0。其他通道也是如此,并且不存在同一个像素点在两个以上通道均为1情况。因此,通过argmax就

    作者: @Wu
    642
    0
  • 计算化学深度学习

    在回顾深度神经网络表现时,我们观察到在不同研究课题中,针对非神经网络最先进模型一致表现优异,而基于深度神经网络模型通常超出了各自任务“玻璃天花板”预期。加上用于训练深度神经网络GPU加速计算成熟度以及用于训练这些网络化学数据指数增长,我们预计深度学习算法将成为计算化学的宝贵工具。

    作者: DrugAI
    发表时间: 2021-07-14 21:06:17
    2200
    0
  • 深度学习应用开发》学习笔记-28

    这个房价预测例子基本就结束了,下面是用TensorBoard来将算法,和模型训练过程一些信息进行可视化。可视化是一件有意见工作,有助于信息理解和推广。可视化在modelarts老版训练作业下,是收费,但这个服务在新版训练作业里已经没有了,也行是因为这个可视化服务使用不

    作者: 黄生
    837
    3
  • 深度学习应用开发》学习笔记-20

    pandas用来处理文件很方便,shuffle就是洗牌,我们打牌,一局结束后需要洗牌后再开始下一局 这里介绍了pandas库,处理常规大小数据文件,会很方便,基于BSD协议库。 可以自动转换为numpy多维数组。 下面是代码 ```python %matplotlib notebook

    作者: 黄生
    934
    3
  • 深度学习应用开发》学习笔记-23

    从人角度来看,12个特征比1个特征要复杂了很多, 但对计算机来说,无所谓。 在tf里,12元线性回归方程实现,比1元线性方程实现,代码上也只是多了一点点复杂度而已。 这就是计算机优势。 只是最后训练结果,为什么都是nan,像老师说,脸都黑了哦~ 这次先到这里,请听下回分解~

    作者: 黄生
    1471
    4
  • 深度学习之浅层网络

    更确切说,他们说明分段线性网络(可以通过整流非线性或 maxout 单元获得)可以表示区域数量是网络深度指数级函数。图 6.5 解释了带有绝对值整流网络是如何创建函数镜像图像,这些函数在某些隐藏单元顶部计算,作用于隐藏单元输入。每个隐藏单元指定在哪里折叠输入空

    作者: 小强鼓掌
    841
    1
  • 深度学习之小更新

    梯度下降和基本上所有的可以有效训练神经网络学习算法,都是基于局部较也许能计算目标函数一些性质,如近似的有偏梯度或正确方向估计方差。在这些情况下,难以确定局部下降能否定义通向有效解足够短路径,但我们并不能真的遵循局部下降路径。目标函数可能有诸如病态条件或不连续梯度问题,使得梯度为目标函数

    作者: 小强鼓掌
    419
    2
  • 优秀开发者为什么要学习研究编程语言?

    很相近语法结构,弄懂学会并不难。计算机算法也是共通。但是考虑到它创建并依赖生态环境、设计思想、开发模式和习惯用法,应用自如还是需要耗费很多精力。这里链接几篇关于学习能力培养、学习方法原创文章,供大家参考:学得快,记得牢,花少 – 请尽快开发你大脑职场人学习方法IT

    作者: SUNSKY
    发表时间: 2019-12-10 13:34:49
    5982
    0