内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 机器学习——模型保存

    对于已经调好参数的模型,我们需要将其保存下来,可以使用下面两种方法。 模型训练 from sklearn.tree import DecisionTreeClassifier from sklearn import

    作者: Python新视野
    发表时间: 2021-09-09 14:16:23
    836
    0
  • 机器学习算法 综述(入门)

     学习了一个学期机器学习算法,从什么都不懂到对十个机器学习算法有一定的了解,下面总结一下十大机器学习算法,从算法的概念、原理、优点、缺点、应用等方面来总结,如果有错误的地方,欢迎指出。 目录   1.决策树 2.线性回归  3.逻辑回归

    作者: 一颗小树x
    发表时间: 2020-12-02 17:21:22
    2142
    0
  • 机器学习笔记之评估方法

    独立同分布采样曲得. 但需注意的是,测试集应该尽可能与训练集互斥,即测试样本尽量不在训练集中出现、 未在训练过程中使用过.测试样本为什么要尽可能不出现在训练集中呢?为理解这一点,不妨考虑这样—个场景:老师出了10道习题供同学们练习,考试时老师又用同样的这10道题作为试题,这个考试

    作者: ypr189
    723
    1
  • 机器学习面试总结】————(三)

    测准确性。 集成学习可以分为两类:bagging和boosting。在bagging中,每个学习器独立地从训练集中随机采样,然后基于这些子集训练多个学习器。在boosting中,学习器是按顺序训练的,每个学习器都试图修正前面学习器的错误。 集成学习常用的算法包括随机森林、Adaboost、Gradient

    作者: Lingxw_w
    发表时间: 2023-04-27 12:39:01
    78
    0
  • 想要使用SPARK进行机器学习训练,缺少算法包怎么办

    我想利用spark进行深度学习相关的模型训练,但是发现DLI服务的队列并没有提供我需要使用的算法包,怎么办?

    作者: kyo
    1457
    2
  • 机器猫说机器学习】如何避免机器学习中的过拟合-FISTA

    5可以得到比q=1更好的稀疏解,具体可以去查下西交徐宗本院士的工作。这里我们仅介绍L1的情况。 通俗的说,loss函数目的是在训练集上最小化empirical risk error,但是当我们学习一个model,希望具备良好的泛化性能。因此,增加一个正则化项,用来平衡模型的structural risk

    作者: hulu可爱多
    发表时间: 2020-11-28 03:51:07
    2972
    0
  • 机器学习“特征编码”(一)

    为什么要进行特征编码?我们拿到的数据通常比较脏乱,可能会带有各种非数字特殊符号,比如中文。下面这个表中显示了我们最原始的数据集。而实际上机器学习模型需要的数据是数字型的,因为只有数字类型才能进行计算。因此,对于各种特殊的特征值,我们都需要对其进行相应的编码,也是量化的过程。2.

    作者: @Wu
    1030
    5
  • 机器学习(四):决策树

    🌟🌟🌟✨✨✨ 前言: 机器学习是目前信息技术中最激动人心的方向之一,其应用已经深入到生活的各个层面且与普通人的日常生活密切相关。🍻🍻🍻 💞作为刚入门机器学习的Dream,同样对机器学习有着极高的兴趣 💞本文为清华大学最新出版的《机器学习》教材的Learning Notes

    作者: 是Dream呀
    发表时间: 2022-04-15 11:50:44
    1418
    0
  • 量子机器学习(MindQuantum)初体验

    com/data/forums/attachment/forum/202105/02/131703lca0mfwlbwwopqk6.png) # 体验内容 ## 量子机器学习(MindQuantum)初体验 ### 安装MindQuantum ![install_mindquantum.png](https://bbs-img

    作者: UnseenMe
    1694
    0
  • 机器学习笔记之留出法

    集合,其中一个集合作为训练集s,另一个作为测试集T,即D=SUT,SnT=0.在S上训 练出模型后,用T来评估其测试误差,作为对泛化误差的估计.以二分类任务为例,假定D包含1000个样本,将其划分为S包含700个样 本,T包含300个样本, 用S 进行训练后,如果模型在T上有90个样本分类错

    作者: ypr189
    1029
    0
  • 机器学习的算法分类介绍

    法提供一组示例供其学习。 (1) 监督式学习:为算法提供训练数据,数据中包含每个示例的“正确答案”;例如,一个检测信用卡欺诈的监督学习算法接受一组记录的交易作为输入,对于每笔交易,训练数据都将包含一个表明它是否存在欺诈的标记。 (2) 无监督学习:该算法在训练数据中寻找结构,比如

    作者: 极客潇
    824
    3
  • 机器学习算法选择(分类一)

    离尽可能减小,而不同类别样本之间的距离尽可能增大。常用的度量学习方法分为全局度量学习和局部度量学习。深度学习也可以与度量学习相结合,利用深度神经网络自适应学习特征表达,当数据量较多时,推荐使用深度度量学习。深度度量学习己经成功用于人脸识别等领域。

    作者: 黄生
    15
    0
  • 机器学习中文资源概览

    我们基本上就能理解机器学习学习过程推导。机器学习方法建议(面向初学者)特征工程开始机器学习的第一步是理解如何评估和改进数据集的质量。管理特征的类别和缺失、归一化和降维(PCA、ICA、NMF)是大幅提高算法性能的基本技术,而且还有助于研究如何将数据集分割成训练集和测试集、如何采

    作者: Smy1121
    发表时间: 2019-07-09 15:02:46
    6122
    0
  • 机器学习(四):机器学习工作流程

    机器学习工作流程 一、什么是机器学习 机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。 ​ 二、机器学习工作流程 机器学习工作流程总结: 1.获取数据 2.数据基本处理 3.特征工程 4.机器学习(模型训练) 5.模型评估 - 结果达到要求,上线服务

    作者: Lansonli
    发表时间: 2023-02-13 14:01:09
    109
    0
  • 机器学习--线性回归、逻辑回归

    一、线性回归 线性回归无非就是训练得到线性函数的参数来回归出一个线性模型,学习《最优化方法》时中的最小二乘问题就是线性回归的问题。 关于线性回归,ng老师的视频里有讲,也可以看此博客单参数线性回归。简要说一下线性回归的原理。 假设拟合直线为h(x)=θ0+θ1*x

    作者: 格图洛书
    发表时间: 2021-12-29 16:23:49
    709
    0
  • 机器学习:算法视角(原书第2版)》 —1.5 机器学习过程

    1.5 机器学习过程本节假设你对使用机器学习感兴趣,并且也对这一过程有一些疑问,例如之前描述的硬币分类。以下简要阐释机器学习算法选择、应用、评估问题的过程。●数据收集和准备:本书配有可以随时下载和使用的数据集来测试算法。当然,在少数情况下,面对新的问题,我们需要从头开始收集数据,

    作者: 华章计算机
    发表时间: 2019-12-21 11:38:53
    3871
    0
  • 深度学习机器学习的算法效果

      当我们使用机器学习算法时,我们不会提前固定参数,然后从数据集中采样。我们会在训练集上采样,然后挑选参数去降低训练集误差,然后再在测试集上采样。在这个过程中,测试误差期望会大于或等于训练误差期望。以下是决定机器学习算法效果是否好的因素:        1. 降低训练误差     

    作者: 小强鼓掌
    726
    3
  • 机器学习(五):机器学习算法分类

    机器学习算法分类 根据数据集组成不同,可以把机器学习算法分为: 监督学习 无监督学习 半监督学习 强化学习 一、监督学习 定义:输入数据是由输入特征值和目标值所组成。 函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(称作分类)。 1、回归问题 例如:预测房价,根据样本集拟合出一条连续曲线。

    作者: Lansonli
    发表时间: 2023-02-18 05:59:28
    71
    0
  • AMD的PyTorch机器学习工具

    Pip 的安装方式。 ROCm 通过不断开发支持主要机器学习框架,如 TensorFlow 和 PyTorch,来加强和优化工作负载加速。AMD 与开源社区广泛合作,来促进和推广深度学习训练和优化。这些不断的努力有助于拓宽机器学习的应用领域,发挥 AMD Radeon Instinct

    作者: RabbitCloud
    645
    2
  • 《Python数据挖掘与机器学习实战》—1.4 机器学习的应用

    万张静态图片,让系统自动学习并判断哪些是猫的图片。实验结果表明,他们所建立的深层网络及其算法,在ImageNet数据集1万张图中效果提升了15%,2.2万张图中效果提升了70%。该网络是一个用16000个CPU并行计算平台训练内部拥有10亿个节点的机器学习模型。  2016年初,

    作者: 华章计算机
    发表时间: 2019-06-17 12:06:12
    4949
    0