内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 大数据机器学习-节选

    示快很多。因此,哈希学习也能解决检索 速度问题。    哈希学习关键问题是怎样从训练 数据中学习到好哈希函数。如果学习哈希函数不能很好地保持原始空间相 似度,基于哈希码表示将得不到好检索效果。根据训练数据是否包含监督信息, 哈希学习可以分为非监督哈希学习、监督 哈希学习和半监督哈希学习;根据训练数

    作者: andyleung
    1171
    1
  • 机器学习笔记之自助法

    每次随机从D挑选一个 样本,将其拷贝放入D' ,然后再将该样本放回初始数据集D,使得该样本在 下次采样时仍有可能被采到;这个过程重复执行m次后,我们就得到了包含m 个样本数据集D',这就是自助采样结果.显然,D中有一部分样本会在D' 多次出现,而另一部分样本不出现. 可

    作者: ypr189
    957
    1
  • 浅学XGBoost机器学习分类算法

    去拟合上次预测残2.当我们训陈练完成得到棵树,我们要预湨一个样本分数,其实就是根据这个样本特征,在每棵树中会落到对应一个叶子节点,每个叶子节点就对应一个分数3.最后只需要将每棵树对应分数加起来就是该样本预湨值。需要带入包from sklearn.metrics import

    作者: QGS
    32
    1
  • 机器学习笔记之留出法

    进行训练后,如果模型在T上有90个样本分类错 误那么其错误率为(90/300)X 100% = 30%,相应,精度为1-30% = 70%. 需注意是,训练/测试集划分要尽可能保持数据分布一致性,避免因数据划分过程引入额外偏差而对最终结果产生影响,例如在 分类任务至少要保持样本类别比例相似.

    作者: ypr189
    1029
    0
  • 机器学习笔记(十一)----降维

     多维缩放中最关键是要求低维空间中样本距离尽可能与原始空间中样本距离保持一致。       假设给定N个样本,表示原始空间中距离矩阵,其中第i行第j列元素dij表示第i个实例和第j个实例之间距离,目标是获得d’维空间中样本表示,且任意两个样本在d’维空间中距离等于在原始空间中的距离,即--

    作者: 云上有未来
    发表时间: 2019-09-21 17:17:05
    4414
    0
  • 机器学习算法(一)

    算可能条件分支概率。每个独立特征都是「朴素」或条件独立,因此它们不会影响别的对象。例如,在一个装有共 5 个黄色和红色小球罐子里,连续拿到两个黄色小球概率是多少?从图中最上方分支可见,前后抓取两个黄色小球概率为 1/10。朴素贝叶斯分类器可以计算多个特征联合条件概率

    作者: @Wu
    542
    1
  • 连接可信机器学习不同主题

    分布数据上训练,用遵从另一个分布一些未标注数据适应后,希望模型将在训练集上学到知识迁移到这个新分布,做出准确预测。自领域对抗网络方法问世以来,学习领域不变表示这一思路在鲁棒性研究迅速普及。另外一大类方法使用生成模型进行数据增强,从训练样本产生符合新分布风格样本。与

    作者: @Wu
    18
    1
  • 样本学习总结(一)

    距离softmax,a对于支撑样本和查询样本Embedding函数是不同,通过C()函数来计算两个Embedding余弦距离支撑样本Embedding是g,是基于双向LSTM来学习,每个支撑样本Embedding是其他支撑集是相关测试样本Embedding是一

    作者: Deep_Rookie
    发表时间: 2020-10-22 20:25:22
    5237
    0
  • 深度学习机器学习挑战

    我们讨论是一个简单优化问题。机器学习和优化不同地方在于,我们也希望泛化误差(generalization error),也被称为测试误差(test error),很低。泛化误差被定义为新输入误差期望。这里,期望取值自我们期望系统在现实从输入分布采样得到不同可能值。

    作者: 小强鼓掌
    821
    3
  • 深度学习机器学习挑战

    我们讨论是一个简单优化问题。机器学习和优化不同地方在于,我们也希望泛化误差(generalization error),也被称为测试误差(test error),很低。泛化误差被定义为新输入误差期望。这里,期望取值自我们期望系统在现实从输入分布采样得到不同可能值。

    作者: 小强鼓掌
    516
    2
  • 【转载】机器学习算法

    作者: andyleung
    1028
    6
  • 机器学习混淆矩阵

    本文深入探讨了机器学习混淆矩阵概念,包括其数学原理、Python实现,以及在实际应用重要性。我们通过一个肺癌诊断实例来演示如何使用混淆矩阵进行模型评估,并提出了多个独特技术洞见。文章旨在为读者提供全面而深入理解,从基础到高级应用。 关注TechLead,分享

    作者: TechLead
    发表时间: 2023-11-14 11:33:59
    18
    0
  • 【玩转标准版MLS系列五】机器学习助力信用风险检测

    1 目的使用机器学习一键式信用风险检测模板,快速识别高信用客户,提高信用卡发放率。147492 场景描述信用是每个人行走在当下社会重要凭证,高信用个人意味着消费能力高,还款及时。信用风险检测是影响银行开展信用卡业务重要环节。银行客户经理在办理信用卡业务前,都会先评估新客户

    作者: 人工智能
    18886
    4
  • 机器学习——集成算法

    1 集成算法概述 集成学习(ensemble learning)是时下非常流行机器学习算法,它本身不是一个单独机器学习算法,而是通过在数据上构建多个模型,集成所有模型建模结果。基本上所有的机器学习领域都可以看到集成学习身影,在现实中集成学习也有相当大作用,它可以用来做市场

    作者: ttking
    751
    0
  • 机器学习之混淆矩阵

    下面再举一个简单的例子,引出更多关于混淆矩阵概念。 混淆矩阵是用来总结一个分类器结果矩阵。对于k元分类,其实它就是一个k x k表格,用来记录分类器预测结果。 对于最常见二元分类来说,它混淆矩阵是2乘2,如下 ![image.png](https://bbs-img.huaweicloud.co

    作者: ttking
    637
    2
  • 机器学习笔记之评估方法

    通常,我们可通过实验测试来对学习泛化误差进行评估并进而做出选择为此,需使用一个 “测试集” (testing set)来测试学习器对新样本判别能力,然后以测试栠上 " 测试误差” (testing error)作为泛化误差近似. 通常我们假设测试样本也是从样本真实分布独立同分布采样曲得.

    作者: ypr189
    723
    1
  • 机器学习(二)——引入

    yy^​来代表我们在训练好模型上通过输入获得相应预测值。 由于训练集中有多个样本,所以我们一般用(xi,yi)(x^{i},y^{i})(xi,yi)来表示第i个样本特征和第i个样本对应输出。 在这一讲下面的学习,我们会用到最简单模型来开始我们机器学习之路,即线性回归模型。

    作者: ArimaMisaki
    发表时间: 2022-04-18 10:56:54
    664
    0
  • 机器学习常识(二):7 个最常见机器学习损失函数

    际值相比损失函数。 损失函数与您构建模型预测直接相关。如果您损失函数值较低,您模型将提供良好结果。您用于评估模型性能损失函数(或者更确切地说,成本函数)需要最小化以提高其性能。 机器学习损失函数是什么? 损失函数是一种评估机器学习算法对特征数据集

    作者: 川川菜鸟
    发表时间: 2022-08-19 14:38:59
    151
    0
  • 机器学习主要步骤

    本文件和数据,除了商业上可用数据源之外;准备数据:这包括数据清理和解析。删除或纠正异常值(失控错误值);这经常占用总时间和工作量60%以上,然后将数据分成两个不同部分,即练数据和测试数据;训练模型:针对一组训练数据—用于识别数据模式或相关性,或者用于做预测,同时

    作者: @Wu
    838
    2
  • 机器学习算法(二)

    network):早期 RNN 形式是会存在损耗。尽管这些早期循环神经网络只允许留存少量早期信息,新近长短期记忆(LSTM)与门控循环单元(GRU)神经网络都有长期与短期记忆。换句话说,这些新近 RNN 拥有更好控制记忆能力,允许保留早先值或是当有必要处理很多系

    作者: @Wu
    825
    0