检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
有趣的是,二十一世纪初,连接主义学习又卷上重来,掀起了以 “深度学习”为名的热潮.所谓深度学习,狭义地说就是 “很多层 " 的神经网络.在若干测试和竞赛上,尤其是涉及语音、 图像等复杂对象的应用中,深度学习技术取得了优越性能以往机器学习技术在应用中要取得好性能,对使用者的要求较高
们让机器学习,不管学习什么,最终目的都是让它独立或至少半独立地进行相对复杂或者高要求的工作。我们在这里提到的机器学习更多是让机器帮助人类做一些大规模的数据识别、分拣、规律总结等人类做起来比较花时间的事情。这个就是机器学习的本质性目的。在人类发展的历史长河中,机器逐步代替人的生产工
改善自身的性能。 它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。海量的数据获取有用的信息机器学习 研究意义机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。
本章涵盖了以下主题:分类和回归之外的其他类型的问题;评估问题,理解过拟合、欠拟合,以及解决这些问题的技巧;为深度学习准备数据。请记住,在本章中讨论的大多数技术都是机器学习和深度学习通用的,一部分用于解决过拟合问题的技术(如dropout)除外。4.1 三类机器学习问题在之前的所有例子中,尝试解决的是分类(
和深度学习都可以处理。比如说,我们去买百香果吃,我们没有买百香果的经验,不知道那些是甜的那些是酸的,然后我们买了一大堆回来,有大的、小的、轻的、重的、红的、紫的、白的、黄的、果皮光滑的、干皱的...然后每一个都尝一便,最后发现,百香果原来有两大类,紫红和黄白两类,紫红类的,果皮越
机器学习工作流 机器学习系统编程模型的首要设计目标是:对开发者的整个工作流进行完整的编程支持。一个常见的机器学习任务一般包含如图所示的流程。这个工作流完成了训练数据集的读取,模型的训练,测试和调试。通过归纳,我们可以将这一工作流中用户所需要自定义的部分通过定义以下
用遍及人工智能的各个领域。机器学习有多种定义方式。一方面,它被视为一种人工智能的科学,主要研究对象是人工智能,特别是在经验学习中如何改善具体算法的性能。另一方面,机器学习也可以理解为对能够通过经验自动改进的计算机算法的研究。此外,机器学习还可以定义为使用数据或以往的经验来优化计算
机器学习算法 需要明确,当前人工智能技术中,机器学习占据了主导地位,但不仅仅包括机器学习,而深度学习是机器学习中的一个子项。目前可以说,学习AI主要的是学习机器学习,但是,人工智能并不等同于机器学习。具体到机器学习的流程,包括数据收集、清洗、预处理,建
改善自身的性能。 它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。 海量的数据 获取有用的信息机器学习 研究意义 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算
识到的行为。这种行为的学习基于三个因素: 程序消耗的数据; 量化当前行为和理想行为之间的误差或某种形式的距离的度量; 使用量化误差指导程序在后续事件中产生更好行为的反馈机制。可以看出,第二个和第三个因素很快使这个概念变得抽象,并强调其深层的数学根源。机器学习理论
绍大数据的综合应用。1.4.1 异常检测异常是指某个数据对象由于测量、收集或自然变异等原因变得不同于正常的数据对象的场景,找出异常的过程,称为异常检测。根据异常的特征,可以将异常分为以下三类:点异常、上下文异常、集合异常。异常检测的训练样本都是非异常样本,假设这些样本的特征服从高
损失函数 损失函数是机器学习里最基础也是最为关键的一个要素,通过对损失函数的定义、优化,就可以衍生到我们现在常用的机器学习等算法中。1.损失函数 损失函数(loss function)是用来估量拟模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,损失函数的作用是衡量模型预测的好坏。通常使用L(Y
用数据存取机制实现数据的高效读写。机器学习在数据分析与挖掘领域中拥有无可取代的地位,2012年Hadoop进军机器学习领域就是一个很好的例子。模式识别模式识别起源于工程领域,而机器学习起源于计算机科学,这两个不同学科的结合带来了模式识别领域的调整和发展。模式识别研究主要集中在两个
对抗样本也提供了一种实现半监督学习的方法。在与数据集中的标签不相关联的点 x 处,模型本身为其分配一些标签 yˆ。模型的标记 yˆ 未必是真正的标签,但如果模型是高品质的,那么 yˆ 提供正确标签的可能性很大。我们可以搜索一个对抗样本 x′,导致分类器输出一个标签 y′ 且 y′
算机科学的学生们,想搞什么研究,结果十个里有九个要研究机器学习,中间还一些弄不清深度学习和机器学习的关系,实际上是想搞深度学习。 原本深度学习(深度神经网络)只是机器学习领域一个分支,但因为其最近大火,导致对整个领域出现了这样的划分:深度的和非深度,或者说深度的和传统的。虽然现
维数 x是样本空间的一个向量 从数据中学习得的模型称为“学习”或者“训练” 每一个样本(每一张猫的照片)称为一个“训练样本”,训练样本的集合 为“训练集” 潜在的规律称为“假设”,也称为“真相”、“真实”,学习过程就是不断 找到真相。 仅仅有前面示例的猫的照片也不够,需
通过上面的分析,可以看出机器学习与人类思考的经验过程是类似的,不过它能考虑更多的情况,执行更加复杂的计算。事实上,机器学习的一个主要目的就是把人类思考归纳经验的过程转化为计算机通过对数据的处理计算得出模型的过程。经过计算机得出的模型能够以近似于人的方式解决很多灵活复杂的问题。
识到的行为。这种行为的学习基于三个因素: 程序消耗的数据; 量化当前行为和理想行为之间的误差或某种形式的距离的度量; 使用量化误差指导程序在后续事件中产生更好行为的反馈机制。可以看出,第二个和第三个因素很快使这个概念变得抽象,并强调其深层的数学根源。机器学习理论
过拟合(高方差) 当我们的数据无法满足我们模型的复杂度时会过拟合,也就是我们的变量过多,模型很复杂,导致在我们的训练集中我们的将我们的训练样本拟合的非常好,但是在测试样本中测试的准确率比较低,模型的泛化能力差,就会出现过拟合的问题。 通俗一点地来说过拟合就是模型把数据学习的太彻底,以至于
到现在为止,我们看到的绝大多数的机器学习的应用环境都非常单纯一一向量清洗到位,边界划定清晰。例如,垃圾邮件的分拣,能够通过邮件内容的输入来判断邮件是否为垃圾邮件;新闻的自动分类,能够通过新闻内容的分类来判断新闻的类别或描述内容的属性;摄像头对车牌号的OCR电子识别手、写识别,这些