内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 机器学习之算法选择

    它直接根据邻近有标签数据投票来对未知签数据进行分类,然而,在实际应用,由于数据样本距离度量方式是不可知,所以KNN算法需要在常用几个距离度量方式中去选择并学习合适度量方式,这时就需要训练,度量学习目的是学习一个度量矩阵,使得在某度量方式下,数据同类样本之间距离尽可能减小

    作者: 运气男孩
    发表时间: 2021-01-17 21:47:45
    3224
    0
  • 机器学习算法 综述(入门)

    这棵树上问题,将数据划分到合适叶子上。 经典决策书是ID3,其中有两个重要概念:熵 和 信息增益 熵:是描述混乱程度   (在模型,熵越小较好) 信息增益:是描述属性(非子叶节点)对模型贡献,信息增益越大对模型贡献越大 优点:计算复杂度不高,输出结果易于理解,对中

    作者: 一颗小树x
    发表时间: 2020-12-03 01:21:22
    5406
    0
  • 机器学习之决策树

    平滑来补值,当样本量很大时候也可以丢弃这些有缺失值样本。 (4)随着数据集不断减小,子集样本量会越来越小,所构造出决策树就可能出现碎片、重复、复制等总是。这时可以利用样本原有特征构造新特征进行建模; (5)信息增益法会倾向于选择取值比较多特征(这是信息熵定义

    作者: 最后一个好人
    发表时间: 2020-11-03 11:31:29
    4974
    0
  • 样本图像分类综述

    贴近现实的场景,在测试时测试样本包含了可见类 和不可见类。由于可见类和不可见类之间类别不平 衡以及零样本学习模型在分类时存在将不可见类归 为可见类可能性,广义零样本学习为零样本学习 带来了新挑战。 近年,基于零样本学习图像分类得到广泛研 究,有效克服了没有标注训练样本局限,取得了很 好分类性能。零样本图像分类指的是训练集和测

    作者: 可爱又积极
    1426
    2
  • AI-机器学习(一)

        提问:人工智能和机器学习,深度学习关系是什么?    其实很简单两句话可以概括三者间关系:机器学习是人工智能一个实现途径,深度学习是机器学习一个方法发展而来。    今天我们先来讲一下机器学习概述,在后面我每周都会持续更新一些我对于机器学习以及算法一些学习心得。说到

    作者: 咔吧咔吧
    发表时间: 2020-10-20 15:57:24
    2848
    0
  • 机器学习笔记之评估方法

    通常,我们可通过实验测试来对学习器泛化误差进行评估并进而做出选择为此,需使用一个 “测试集” (testing set)来测试学习器对新样本判别能力,然后以测试栠上 " 测试误差” (testing error)作为泛化误差近似. 通常我们假设测试样本也是从样本真实分布独立同分布采样曲得.

    作者: ypr189
    723
    1
  • 机器学习】(4):监督式学习

    机器学习监督式学习是非常重要一类,因为ML主要出发点是利用获得数据来补偿未知知识,所以从训练集出发学习数据模式规律就是最为自然一类 情况。今天开始自己决定利用两周左右时间,来记录整理自己学习机器学习笔记,主要参考资料是Ethen Alpaydin机器学习

    作者: 技术火炬手
    发表时间: 2019-02-21 15:36:29
    4643
    0
  • 浅学XGBoost机器学习分类算法

    其实是学习一个新函数f(x),去拟合上次预测残2.当我们训陈练完成得到棵树,我们要预湨一个样本分数,其实就是根据这个样本特征,在每棵树中会落到对应一个叶子节点,每个叶子节点就对应一个分数3.最后只需要将每棵树对应分数加起来就是该样本预湨值。需要带入包from sklearn.metrics

    作者: QGS
    34
    1
  • 机器学习之深度学习

    有趣是,二十一世纪初,连接主义学习又卷上重来,掀起了以 “深度学习”为名热潮.所谓深度学习,狭义地说就是 “很多层 " 神经网络.在若干测试和竞赛上,尤其是涉及语音、 图像等复杂对象应用,深度学习技术取得了优越性能以往机器学习技术在应用要取得好性能,对使用者要求较高

    作者: ypr189
    731
    1
  • 机器学习基础图表-机器学习类型

    发送到你邮箱。也许你会问这个分类算法对于SSD有什么用呢?SSD一个典型分类问题是IO模式识别,判断IO是纯读、纯写或者混合读写,这是一个三分类问题;判断IO是顺序还是随机,这是一个二分类问题。可以根据实际情况选择相应相应机器学习分类算法识别出不同IO模式

    作者: @Wu
    1477
    3
  • 《AI安全之对抗样本入门》—1.3.4 典型CNN结构

    1.3.4 典型CNN结构典型CNN包含卷积层、全连接层等组件,并采用softmax多类别分类器和多类交叉熵损失函数,一个典型卷积神经网络如图1-19所示。 图1-19 典型CNN结构我们先介绍用来构造CNN常见组件:卷积层:执行卷积操作提取底层到高层特征,挖掘出图片

    作者: 华章计算机
    发表时间: 2019-06-17 15:59:42
    5403
    0
  • 为什么要将样本方差除以 N-1

    为了计算均值和方差,我们显然需要来自此分布多个样本。在下文中,设vector 是包含所有可用样本(例如,表 1 示例所有值)向量。如果所有这些样本在统计上都是独立,我们可以将它们联合似然函数写成所有单个似然总和: (5) 将方程(4)插入方程(5),然后得到这个联合概率密度函数解析表达式:

    作者: irrational
    发表时间: 2022-01-17 16:48:25
    450
    0
  • 目标引导的人类注意力估计提升零样本学习

    L也表现优异,达到第二性能。对于SUN,因为存在700多个类别,基于生成模型模型方法在此数据集上会表现更好一些,但是GEM-ZSL在非生成模型也是具有竞争力。为了对所提方法各个模块性能进行分析,研究者们进行了大量消融实验:除了对零样本学习任务验证,研究者们在Gaze

    作者: 可爱又积极
    1314
    1
  • 【MindSpore易点通】机器学习系列:机器学习系统设计

    可以做很多事,例如:收集更多数据,让我们有更多**邮件和非**邮件样本基于邮件路由信息开发一系列复杂特征基于邮件正文信息开发一系列复杂特征,包括考虑截词处理为探测刻意拼写错误(把watch写成w4tch)开发复杂算法在上面这些选择,应该具体研究哪一个算法并且

    作者: Skytier
    2154
    2
  • 如何使用sha256生成用于样本对齐id字段

    在TICS可信智能计算服务,进行模型训练前要求提供数据集双方执行样本对齐,建立起描述相同样本特征和标签之间对应关系。在实际生产业务往往使用手机、身份证等唯一性较高字段作为id列,但出于用户隐私保护考虑,这些数据不建议使用明文方式进行样本对齐,TICS建议使用SHA256散列算法对

    作者: tics神奇海螺
    110
    0
  • 大数据机器学习-节选

    哈希学习和分布式随机学习两个方向探索大 数据机器学习技术,来解决相应挑战。    1 哈希学习 哈希学习最初是用于大数据最近 邻检索任务,近年来被推广到其他多种机 器学习任务。在最近邻检索任务,给定 一个查询样本,系统需要从数据检索 出和查询样本最相似的一个或多个样本。 当数据样本数特别大时,最近邻检

    作者: andyleung
    1171
    1
  • 机器学习分类

    对数据初步认识以及学习目的分析,选择合适数学模型,拟定超参数,并输入样本数据,依据一定策略,运用合适学习算法对模型进行训练,最后运用训练好模型对数据进行分析预测。统计机器学习三个要素:模型(model):模型在未进行训练前,其可能参数是多个甚至无穷,故可能模型也

    作者: QGS
    445
    0
  • 《AI安全之对抗样本入门》—3 常见深度学习平台简介

    c:3})9如果在jupyter运行程序显示对应没有安装,很大可能是对应jupyter核心没有设置,无法使用对应anaconda环境。一个推荐做法是配置你经常使用anaconda环境到IPython核心。以本书为例,使用环境名称为book5,进入jupyter核心对应配置路径,比如

    作者: 华章计算机
    发表时间: 2019-06-17 18:09:38
    3402
    0
  • 【《机器学习》周志华学习笔记1.3】~机器学习“假设空间”到底是什么?“归纳学习”又是什么?“布尔概念”呢?

              假设空间相当于是对数据集全组合,对未知情况也进行组合,以便得到更加普遍“泛化” 结果。 现实生活,假设空间都很大,而训练样本有限, 因此可能存在一个 与训练集一致“假设集合”,我们称为“版本空间” 表1对应版本空间为:                

    作者: 王博Kings
    发表时间: 2020-12-30 00:08:20
    5595
    0
  • 机器学习基础】损失函数

    损失函数  损失函数是机器学习里最基础也是最为关键一个要素,通过对损失函数定义、优化,就可以衍生到我们现在常用机器学习等算法。1.损失函数  损失函数(loss function)是用来估量拟模型预测值f(x)与真实值Y不一致程度,它是一个非负实值函数,损失函数作用是衡量模型预测的好坏。通常使用L(Y

    作者: Micker
    发表时间: 2020-06-30 22:17:34
    9474
    0