检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
对抗样本也提供了一种实现半监督学习的方法。在与数据集中的标签不相关联的点 x 处,模型本身为其分配一些标签 yˆ。模型的标记 yˆ 未必是真正的标签,但如果模型是高品质的,那么 yˆ 提供正确标签的可能性很大。我们可以搜索一个对抗样本 x′,导致分类器输出一个标签 y′ 且 y′
最常用的方法是输出模型在一些样本上概率对数的平均值。通常,我们会更加关注机器学习算法在未观测数据上的性能如何,因为这将决定其在现实生活中的性能如何。因此,我们使用测试数据来评估系统性能,同训练机器学习系统的数据分开。性能度量的选择或许看上去简单且客观,但是选择一个与系统理想表现
是输出模型在一些样本上概率对数的平均值。 通常,我们会更加关注机器学习算法在未观测数据上的性能如何,因为这将决定其在现实生活中的性能如何。因此,我们使用测试数据来评估系统性能,同训练机器学习系统的数据分开。性能度量的选择或许看上去简单且客观,但是选择一个与系统理想表现对应的性能度量通常是很难的。
数据的维数很高时,很多机器学习问题变得相当困难。这种现象被称为维数灾难 (curse of dimensionality)。特别值得注意的是,一组变量不同的可能配置数量会随着变量数目的增加而指数级增长。由维数灾难带来的一个挑战是统计挑战。如图5.9所示,统计挑战产生于 x 的可能
h 的几何深度学习扩展库 3 TensorFlow TensorFlow - Google 使用数据流图进行可扩展机器学习的计算 TensorLayer - 面向研究人员和工程师的深度学习和强化学习库。 TFLearn - 深度学习库,具有更高级别的
正如前面提到的,我们将操作的定义限制为返回单个张量的函数。大多数软件实现需要支持可以返回多个张量的操作。例如,如果我们希望计算张量中的最大值和该值的索引,则最好在单次运算中计算两者,因此将该过程实现为具有两个输出的操作效率更高。我们还没有描述如何控制反向传播的内存消耗。反向传播经
我们使用反向传播作为一种策略来避免多次计算链式法则中的相同子表达式。由于这些重复子表达式的存在,简单的算法可能具有指数运行时间。现在我们已经详细说明了反向传播算法,我们可以去理解它的计算成本。如果我们假设每个操作的执行都有大致相同的开销,那么我们可以依据执行操作的数量来分析计算成
一些反向传播的方法采用计算图和一组用于图的输入的数值,然后返回在这些输入值处梯度的一组数值。我们将这种方法称为符号到数值的微分。这种方法用在诸如 Torch (Collobert et al., 2011b) 和 Caffe (Jia, 2013) 之类的库中。另一种方法是采用计算
有时候,在 x 的所有可能值下最大化或最小化一个函数 f(x) 不是我们所希望的。相反,我们可能希望在 x 的某些集合 S 中找 f(x) 的最大值或最小值。这被称为约束优化 (constrained optimization)。在约束优化术语中,集合 S 内的点 x
标量:一个标量就是一个单独的数,不同于线性代数中大多数概念会涉及到多个数。我们用斜体表示标量。标量通常赋予小写的变量名称。当我们介绍标量时,会明确它们是哪种类型的数。比如,在定义实数标量时,我们可能会说“让s ∈ R 表示一条线的斜率”;在定义自然数标量时,我们可能会说“让n
1.1 打开Anaconda Prompt1、conda create -n pytorch python=3.7.0:创建名为pytorch的虚拟环境,并为该环境安装python=3.7。2、activate pytorch:激活名为pytorch的环境1.2 确定硬件支持的C
点和输入区域之间形成一一对应的关系。每个叶结点将其输入区域的每个点映射到相同的输出。决策树通常有特定的训练算法,超出了本书的范围。如果允许学习任意大小的决策树,那么可以被视作非参数算法。然而实践中通常有大小限制作为正则化项将其转变成有参模型。由于决策树通常使用坐标轴相关的拆分,并
(Neal, 1996)比Dropout表现得更好 (Srivastava et al., 2014)。当有其他未分类的数据可用时,无监督特征学习也比Dropout更有优势。
(Tang and Eliasmith, 2010)。改善神经网络健壮性的方法之一是简单地将随机噪声添加到输入再进行训练。输入噪声注入是一些无监督学习算法的一部分,如去噪自编码器(Vincent et al., 2008a)。向隐藏单元施加噪声也是可行的,这可以被看作在多个抽象层上进行的数据集增强。Poole
带着这些学习目标,让我们一起学习深度学习的内容吧~ 目录 深度学习简介 训练法则 正则化 优化器 神经网络类型 常见问题 1. 深度学习简介 首先,我们看下如下图传统机器学习和深度学习的一种比较。众所周知深度学习是属于机器学习,但是由于大多数深度学习的样本是没有标签的,而且在神
常见的语义分割算法属于有监督学习,因此标注好的数据集必不可少。公开的语义分割数据集有很多,目前学术界主要有三个benchmark(数据集)用于模型训练和测试。第一个常用的数据集是Pascal VOC系列。这个系列中目前较流行的是VOC2012,Pascal Context等类似的
实的后盾!谨以此书献给众多热爱深度学习算法及MXNet的朋友们! 魏凯峰 CONTENTS目 录前言第1章 全面认识MXNet11.1 人工智能、机器学习与深度学习21.1.1 人工智能21.1.2 机器学习21.1.3 深度学习41.2 深度学习框架41.2.1 MXNet61
学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。深度学习在搜索技术,数据挖掘,机器学习,