内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • Python大规模机器学习》—1.3 ​Python

    组是按多维排列的数据块,用于实现数学向量和矩阵。数组不仅适用于存储数据,而且适用于快速矩阵运算(矢量化),这在解决特殊数据科学问题时是必不可少的。 网站:http://www.numpy.org/ 撰写本书时的版本:1.11.1 建议安装命令: 作为Python社区广泛采用的约定

    作者: 华章计算机
    发表时间: 2019-06-12 20:38:59
    2331
    0
  • Python大规模机器学习》—1.2.2 ​安装Python

    1.2.2 安装Python首先,创建一个数据科学工作环境,使用它来复制和运行本书中的示例,并为你自己的大型解决方案构建原型。无论你使用何种语言开发应用程序,Python都能轻松地获取你的数据,并从中构建模型,然后提取你在生产环境中进行预测所需的正确参数。Python是一种开源、面

    作者: 华章计算机
    发表时间: 2019-06-12 17:10:54
    2219
    0
  • Python数据挖掘与机器学习实战》—3.5.3 编码实现

    最后生成真正在模型中使用的数据X?y,以及预测时用到的数据数据X_lately  X = np.array(df.drop(['label'], 1))  X = preprocessing.scale(X)  # 上面生成label列时留下的最后1%行的数据,这些行并没有label数据,因此可以拿它们

    作者: 华章计算机
    发表时间: 2019-06-17 14:13:27
    3217
    0
  • Python数据挖掘与机器学习实战》—3.4 用Python实现多元线性回归

    4 用Python实现多元线性回归  当结果值的影响因素有多个时,可以采用多元线性回归模型。例如,商品的销售额可能与电视广告投入、收音机广告投入和报纸广告投入有关系,可以有:   (3-7)3.4.1 使用pandas读取数据  pandas是一个用于数据探索、数据分析和数据处理的Python库。

    作者: 华章计算机
    发表时间: 2019-06-17 13:53:33
    5965
    0
  • 浅谈开源的Python机器学习库:PyTorch

    PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。2017年1月,由Facebook人工智能研究院(FAIR)基于Torch推出了PyTorch。它是一个基于Python的可续计算包,提供两个高级功能:1、具有强大的GPU加速的张量计算

    作者: QGS
    32
    1
  • Python大规模机器学习》 —1.1.2 介绍Python

    1.2介绍Python由于本书依赖Python这种开源语言,因此,在阐述Python如何轻松地帮助你解决大数据问题之前,有必要先介绍一下该语言。Python创建于1991年,是一种通用的解释型的面向对象的语言。它已经逐渐而稳定地征服了科学界,并发展为一个成熟而专业的数据处理和分析

    作者: 华章计算机
    发表时间: 2020-02-14 17:46:53
    2689
    0
  • Python数据挖掘与机器学习实战》—1.7.3 PyCharm简介

    1.7.3 PyCharm简介  PyCharm是由JetBrains打造的一款Python IDE,是使用比较广泛的Python IDE,其功能十分强大,具备一般编译器的特点,如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试和版本控制等。PyChar

    作者: 华章计算机
    发表时间: 2019-06-17 12:18:18
    3373
    0
  • 添加监控数据

    添加监控数据 场景描述 组合架构 参考示例 父主题: 使用场景

  • Python大规模机器学习》 —1.2.2安装Python

    1.2.2安装Python首先,创建一个数据科学工作环境,使用它来复制和运行本书中的示例,并为你自己的大型解决方案构建原型。无论你使用何种语言开发应用程序,Python都能轻松地获取你的数据,并从中构建模型,然后提取你在生产环境中进行预测所需的正确参数。Python是一种开源、面

    作者: 华章计算机
    发表时间: 2020-02-14 19:20:08
    2565
    0
  • DataScience:数据生成之在原始数据添加小量噪声进而实现构造新数据

    DataScience:数据生成之在原始数据添加小量噪声进而实现构造新数据 目录 数据生成之在原始数据添加小量噪声进而实现构造新数据 输出结果 设计思路 相关文章DataScience:数据生成之在原始数据添加小量噪声进而实现构造新数据Data

    作者: 一个处女座的程序猿
    发表时间: 2021-12-13 14:30:32
    911
    0
  • Python数据挖掘与机器学习实战》—2.9.2 XPath介绍

    2 XPath介绍  Xpath是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。XPath提出的初衷是将其作为一个通用的、介于XPointer与XSLT间的语法模型,但是由于XPath用起来非常

    作者: 华章计算机
    发表时间: 2019-06-17 13:19:24
    2810
    0
  • Python数据挖掘与机器学习实战》—1.3.4 深度学习

    深度学习  我们要想具有更强的智慧,除了拥有大量的数据以外还要有好的经验总结方法。深度学习就是一种实现这种机器学习的优秀技术。深度学习本身是神经网络算法的衍生。作为深度学习父类的机器学习,是人工智能的核心,它属于人工智能的一个分支。深度学习是新兴的机器学习研究领域,旨在研究如何从数据中自动地提取多层特征表示

    作者: 华章计算机
    发表时间: 2019-06-17 12:04:21
    3729
    0
  • Python数据挖掘与机器学习实战》—2.1.3 运行和保存Python程序

    2.1.3 运行和保存Python程序  如果程序员每次想用Python程序时都需要重新输入则费时费力,非常影响效率。当然,如果只是几十行的小程序,重写也是可行的,但对于一些大型的程序,其中可能包含有数十万行甚至更多的代码,想象一下,要把这么多的代码进行重写是多么的困难。幸运地是

    作者: 华章计算机
    发表时间: 2019-06-17 12:32:26
    2899
    0
  • Python机器学习算法之决策树算法

    值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法。分类算法是利用训练样本集获得分类函数即分类模型(分类器),从而实现将数据集中的样本划分到各个类中。分类模型通过学习训练样本中属性集与类别之间的潜在关系,并以此为依据对新样本属于哪一类进行预测。

    作者: 淼
    835
    1
  • Python数据挖掘与机器学习实战》—2.1.2 安装Spyder

    2.1.2 安装Spyder  Spyder是Python的作者为Python开发的一个简单的集成开发环境。和其他的Python开发环境相比,Spyder的最大优点就是模仿MATLAB的“工作空间”的功能,可以很方便地观察和修改数组的值。  在“开始”菜单中打开Anaconda3(64-bit),单击Anaconda

    作者: 华章计算机
    发表时间: 2019-06-17 12:30:59
    3117
    0
  • 【武汉HDZ】Python算法--常用降维方法--机器学习简介

    至是在用户完全无感知的情况下被控制访问等产生的不由用户主观发出的行为数据带来了巨大的噪声模型训练造成了很大影响。  希望基于给定的数据,建立一个模型来识别和标记作弊流量,去除数据噪声,从而更好的使用数据,使得广告主的利益最大化。

    作者: Micker
    6188
    1
  • Python 数据清理实战

    数据筛选数据清洗之 数据增加和删除数据清洗之 数据修改和查找数据清洗之 数据整理数据清洗之 层次化索引数据清洗之数据转换数据清洗之 日期格式数据处理数据清洗之 高阶函数处理数据清洗之 字符串数据处理数据清洗之数据统计数据清洗之 数据分组方法数据清洗之 聚合函数使用数据清洗之 分组对象与apply函数数据清洗之

    作者: 外围的小尘埃
    2097
    3
  • Python3智能数据分析快速入门》—1.1.4 Python机器学习优势

    1.1.4 Python机器学习优势Python机器学习领域最优秀的编程语言之一,与同样支持机器学习且自带机器学习应用的MATLAB不同的是,由于Python是开源项目,所以几乎所有必要的组件都是完全免费的。当前机器学习领域的主流编程语言为Python、R、MATLAB、Jav

    作者: 华章计算机
    发表时间: 2019-07-19 15:10:40
    4316
    0
  • Python大规模机器学习》 —3.1.2森林覆盖类型数据

    3.1.2森林覆盖类型数据集由Jock A.Blackard、Denis J.Dean博士、Charles W.Anderson博士和科罗拉多州大学捐赠的森林覆盖类型数据集包含581 012个实例和从海拔到土壤类型等54个类别变量,能够预测七种森林覆盖类型(所以是个多类问题)。为

    作者: 华章计算机
    发表时间: 2020-02-14 22:10:07
    5157
    0
  • Python数据挖掘与机器学习实战》—3.4.3 线性回归模型

    8 10.8 58.4    (200, 3)   查看数据集中的数据,代码如下:   #从DataFrame中选择一个Series  y = data['Sales']  y = data.Sales  #输出前5项数据  print (y.head())   输出的结果如下:

    作者: 华章计算机
    发表时间: 2019-06-17 14:04:03
    4214
    0