内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 机器学习的定义

    我们可以对机器学习过程做一个完整的回顾。首先,我们需要在计算机中存储历史的数据。接着,我们将这些 数据通过机器学习算法进行处理,这个过程在机器学习中叫做“训练”,处理的结果可以被我们用来对新的数据进行预测,这个结果一般称之为“模型”。对新数据 的预测过程在机器学习中叫做“预测”

    作者: 小强鼓掌
    846
    1
  • 机器学习算法建模

    对构成了用于建立模型的标签数据,以便学习如何从输入中预测输出。    无监督学习:是一种只利用输入X变量的机器学习任务。X变量是未标记的数据学习算法在建模时使用的是数据的固有结构。    强化学习:是一种决定下一步行动方案的机器学习任务,它通过试错学习(trial and error

    作者: QGS
    1061
    3
  • Python大规模机器学习》—1.1.4 ​使用Python进行向外扩展

    1.4 使用Python进行向外扩展这只需将多台计算机连接成一个集群即可。连接机器(向外扩展)时,你还可以使用更强大的配置(从而扩展CPU、内存和I/O)来扩展其中的每一个,从而应用前面提到的技术并提高它们的性能。通过连接多台机器,能够以并行方式利用其计算能力。待处理数据将分布在多

    作者: 华章计算机
    发表时间: 2019-06-12 16:53:58
    2235
    0
  • Python大规模机器学习》 —1.1.4使用Python进行向外扩展

    1.4使用Python进行向外扩展这只需将多台计算机连接成一个集群即可。连接机器(向外扩展)时,你还可以使用更强大的配置(从而扩展CPU、内存和I/O)来扩展其中的每一个,从而应用前面提到的技术并提高它们的性能。通过连接多台机器,能够以并行方式利用其计算能力。待处理数据将分布在多

    作者: 华章计算机
    发表时间: 2020-02-14 17:51:33
    2615
    0
  • Python大规模机器学习》 —2.4.5使用SGD

    5使用SGD作为本章结论,我们将实现两个示例:一个为基于森林覆盖数据的分类,另一个为基于共享单车数据集的回归。我们将看到如何将先前关于响应和特征分布的见解付诸实践,以及如何针对每个问题使用最佳的验证策略。从分类问题入手,有两个值得注意的方面需要考虑。作为一个多类问题,首先我们注意到数据库存在某种排序,并且类沿着实例流分布。作为第一步,我们将使用在2

    作者: 华章计算机
    发表时间: 2020-02-14 22:02:52
    4604
    0
  • Python大规模机器学习》—2.4.5 ​使用SGD

    使用SGD作为本章结论,我们将实现两个示例:一个为基于森林覆盖数据的分类,另一个为基于共享单车数据集的回归。我们将看到如何将先前关于响应和特征分布的见解付诸实践,以及如何针对每个问题使用最佳的验证策略。从分类问题入手,有两个值得注意的方面需要考虑。作为一个多类问题,首先我们注意到数据库存在某种排序,并且类沿着实例流分布。作为第一步,我们将使用在2

    作者: 华章计算机
    发表时间: 2019-06-12 22:45:11
    2325
    0
  • Python大规模机器学习》 —3.5超参数调整

    Tricks”中所说的那样:“数学上随机梯度下降与训练集大小完全无关。”所有关键参数都是如此,但仅学习率除外;对于样本效果更好的学习率对整个数据来说效果最好。另外,通过在小采样数据集上尝试收敛,能猜测理想的数据传递次数。根据经验,我们汇总了算法检查的10**6个示例的指示性数量,正如Sciki

    作者: 华章计算机
    发表时间: 2020-02-14 22:34:46
    6027
    0
  • Python大规模机器学习》—3.5 ​超参数调整

    Tricks”中所说的那样:“数学上随机梯度下降与训练集大小完全无关。”所有关键参数都是如此,但仅学习率除外;对于样本效果更好的学习率对整个数据来说效果最好。另外,通过在小采样数据集上尝试收敛,能猜测理想的数据传递次数。根据经验,我们汇总了算法检查的10**6个示例的指示性数量,正如Sciki

    作者: 华章计算机
    发表时间: 2019-06-13 16:36:25
    3213
    0
  • Python数据分析 那种顾客喜欢小费

    单纯的学习数据处理、数据分析知识还是比较枯燥的,在实际案例中演练会让这个过程变得有趣,学习效果也会更好。 今天主要分析那种顾客更喜欢小费,相关数据来源于 seaborn 自带数据集,代码示例是在 jupyter notebook 环境中进行的。 导入用到的库 %matplotlib

    作者: 叶庭云
    发表时间: 2021-08-04 16:07:06
    2115
    0
  • 总结Python机器学习中的回归算法

    下面我带大家整理下机器学习的回归算法 基本回归方法(线性、决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT) 下面是源码 import numpy as np import matplotlib.pyplot as plt def get_data():

    作者: 毛利
    发表时间: 2021-07-14 22:14:05
    901
    0
  • 数据噪声很大的时候一般怎么处理

    数据噪声很大的时候一般怎么处理

    作者: 糖糖糖@糖
    5186
    1
  • 机器学习第一部分:python库相关(含附件)

    作者|程哥应某些要求,发布第一部分内容,主要是python机器学习相关的库函数,本人胶片水平有限,大家见谅~~机器学习python库相关.pdf( 预览 )

    作者: 华为云社区精选
    6077
    3
  • 机器学习 组成

    秀】非监督学习(unsupervised learing)在机器学习,无监督学习的问题是,在未加标签的数据中,试图找到隐藏的结构。因为提供给学习者的实例是未标记的,因此没有错误或报酬信号来评估潜在的解决方案。无监督学习是密切相关的统计数据密度估计的问题。然而无监督学习还包括寻求,

    作者: 角动量
    1742
    3
  • Python数据挖掘与机器学习实战》—3.5 基于线性回归的股票预测

    High)、最低价(Adj.Low)、收盘价(Adj.Close)和交易额(Adj.Volume)。获取到的原始数据如图3-5所示。 图3-5数据集中的部分数据示例1 图3-5数据集中的部分数据示例2

    作者: 华章计算机
    发表时间: 2019-06-17 14:05:48
    5954
    0
  • 经典机器学习算法

    经典机器学习算法源自1950年代的纯统计学。统计学家们解决的是诸如寻找数字中的模式、估计数据点间的距离以及计算向量方向这样的形式数学(formal math)问题。 今天,一半的互联网都在研究这些算法。当你看到一列“继续阅读”的文章,或者在某个偏僻的加油站发现自己的银行卡被锁定而

    作者: yyy7124
    828
    1
  • Python大规模机器学习》—3 实现快速SVM

    将它作为替代线性模型的机器学习算法,并采用不同方法解决从数据学习的问题。然后,在面对大规模数据,尤其是高数据(有很多待学习案例的数据集)时,演示如何利用已有特征创造更丰富的特征,以便更好完成机器学习任务。综上所述,本章讨论以下主题: 介绍SVM的基本概念和数学公式并了解其工作原理。

    作者: 华章计算机
    发表时间: 2019-06-12 22:54:09
    2599
    0
  • Python大规模机器学习》 —3 实现快速SVM

    将它作为替代线性模型的机器学习算法,并采用不同方法解决从数据学习的问题。然后,在面对大规模数据,尤其是高数据(有很多待学习案例的数据集)时,演示如何利用已有特征创造更丰富的特征,以便更好完成机器学习任务。综上所述,本章讨论以下主题: 介绍SVM的基本概念和数学公式并了解其工作原理。

    作者: 华章计算机
    发表时间: 2020-02-14 22:07:52
    5099
    0
  • Python数据结构类型——元组,字典《深度学习导论与应用实践》

    元组中是非法应用字典在Python中,字典(dictionary)是除列表以外最灵活的内置数据类型。列表是有序的,通过索引进行存取,而字典是无序的对象集合,通过键值对来存取数据。字典存储的数据可以是任意类型对象。字典里的键是唯一的,值不需要唯一。字典里的键的数据类型是不可变的,如字

    作者: QGS
    737
    5
  • Python建立数据

    所谓数据库,即存储数据的仓库。每一个数据库可以存放若干个数据表,这里的数据表就是我们通常所说的二维表,分为行和列,每一行称为一条记录,每一列称为一个字段。表中的列是固定的,可变的是行。要注意,我们通常在列中指定数据的类型,在行中添加数据,即我们每次添加一条记录,就添加一行,而不是

    作者: 旧时光里的温柔
    1264
    0
  • Python大规模机器学习》—3.2 支持向量机

    为了解如何将它扩展到大数据奠定基础。历史上,SVM就像感知器一样被认为是硬边界分类器。实际上,最初SVM被设置为试图找到两个超平面,它们能将相互距离可能最大的类分开。这种方法可以很好处理线性可分的合成数据。无论如何,在硬边界版本中,SVM面对非线性可分数据时只能使用特征非线性变换

    作者: 华章计算机
    发表时间: 2019-06-12 23:08:45
    2705
    0