已找到以下 10000 条记录。
  • 使用强化学习内置环境

    05/10/214611s75kapmgyvyjhb7n.png) #### 进入AI Gallery订阅强化学习算法 ModelArts预置的强化学习算法(名为“强化学习预置算法”)发布在AI Gallery中。您可以前往AI Gallery,订阅此模型,然后同步至ModelArts中。

    作者: 运气男孩
    924
    1
  • easyRL学习笔记:强化学习基础

    习是异策略的每次算maxQ,第六章深度Q网络是只属于异策略部分的一个深度算法。 第六章刚开始的价值函数近似只有Q函数近似,是不是就是说策略迭代时候从Q表格找maxQ用近似函数代替,价值迭代时候不需要近似V函数,然后这个近似Q和不近似的V再用深度网络训练。 DQN里还有目标网络,是

    作者: irrational
    发表时间: 2022-08-30 16:46:05
    288
    0
  • 深度学习:Xavier初始化理论+代码实现

    @TOC Xavier初始化理论 权值初始化对网络优化至关重要。早年深度神经网络无法有效训练的一个重要原因就是早期人们对初始化不太重视。我们早期用的方法大部分都是随机初始化,而随着网络深度的加深,随机初始化在控制数值稳定性上也可能失效。Xavier这个方法可以考虑输入层与输出层的维度,使在forward

    作者: hanzee_
    发表时间: 2022-10-14 05:50:16
    791
    0
  • 使用强化学习内置环境

    05/10/214611s75kapmgyvyjhb7n.png) #### 进入AI Gallery订阅强化学习算法 ModelArts预置的强化学习算法(名为“强化学习预置算法”)发布在AI Gallery中。您可以前往AI Gallery,订阅此模型,然后同步至ModelArts中。

    作者: 运气男孩
    1563
    3
  • 学习《强化学习的落地实践》有感

    今天观看了郝建业老师的《强化学习落地实践》的报告直播,颇有收获。首先,郝建业老师对强化学习的基本知识、发展历史进行了讲解,展示了深度学习与强化学习的深层差异。 随后,老师讲解了目前的深度强化学习存在的问题:学习效率底下,所需资源庞大。相比之下,人类不是从头学习,而是从过往的知识中

    作者: Thund1r
    发表时间: 2020-03-13 10:05:39
    4744
    0
  • 【王喆-推荐系统】模型篇-(task9)强化学习推荐模型DRN

    更高效,能根据用户的实时奖励学到新知识,做出最实时的反馈。 文章目录 学习总结一、强化学习基本概念1.1 强化学习框架的六要素 二、强化学习推荐系统框架三、深度强化学习推荐模型 DRN四、DRN 的学习过程4.1 离线部分4.2 在线部分 五、DRN 的在线学习方法:竞争梯度下降算法5

    作者: 野猪佩奇996
    发表时间: 2022-01-22 17:44:21
    1787
    0
  • 什么是 强化学习 (Reinforcement Learning)

    强化学习是机器学习大家族中的一大类, 使用强化学习能够让机器学着如何在环境中拿到高分, 表现出优秀的成绩. 而这些成绩背后却是他所付出的辛苦劳动, 不断的试错, 不断地尝试, 累积经验, 学习经验.强化学习是一类算法, 是让计算机实现从一开始什么都不懂, 脑袋里没有一点想法, 通过不断地尝试

    作者: 角动量
    1871
    1
  • 【MindSpore易点通】强化学习系列之强化学习的基本求解方法(一)

    1. 简介上一节主要介绍了强化学习的基本概念,主要是通过设定场景带入强化学习的策略、奖励、状态、价值进行介绍。有了基本的元素之后,就借助马尔可夫决策过程将强化学习的任务抽象出来,最后使用贝尔曼方程进行表述。本次内容主要是介绍强化学习的求解方法。也等同于优化贝尔曼方程。2. 贝尔曼

    作者: chengxiaoli
    1353
    0
  • 基于深度学习的海洋鱼类识别算法matlab仿真

    sp;   综上所述,基于深度学习的海洋鱼类识别算法主要通过构建和训练深度卷积神经网络,从大量标注的海洋鱼类图像中学习特征,进而对未知图像进行准确的鱼类种类识别。这个过程涉及到复杂的数学运算和优化策略,体现了深度学习在图像识别领域的强大能力。    

    作者: 简简单单做算法
    发表时间: 2024-04-08 20:50:28
    67
    0
  • 深度强化学习应用落地即将迎来春天?

    作者 | 杨鲤萍转自 | AI科技评论编辑 | 唐里深度强化学习(Deep Reinforcement Learning,DRL)一直是近年来人工智能的一些重大突破的核心。然而,尽管 DRL 有了很大的进步,但由于缺乏工具和库,DRL 方法在主流解决方案中仍然难以应用。因此,DRL

    作者: 橘座
    发表时间: 2019-11-02 08:23:38
    3425
    0
  • 深度学习】嘿马深度学习笔记第4篇:TensorFlow介绍,学习目标【附代码文档】

    1 案例:xml读取本地文件存储到pkl 5.2.1.1 解析结构 完整笔记资料代码->:https://gitee.com/yinuo112/AI/tree/master/深度学习/嘿马深度学习笔记/note.md 感兴趣的小伙伴可以自取哦~ 全套教程部分目录: 部分文件图片:

    作者: 程序员一诺python
    发表时间: 2024-08-24 21:47:08
    23
    0
  • 基于深度学习的鸟类识别系统matlab仿真

    算法运行软件版本 matlab2022a   3.算法理论概述         鸟类识别是计算机视觉领域中的一个重要应用,它要求系统能够准确地从图像或视频中识别出鸟的种类。随着深度学习技术的发展,特别

    作者: 简简单单做算法
    发表时间: 2024-02-27 19:09:23
    2
    0
  • 强化学习网络模型

    每一个自主体是由两个神经网络模块组成,即行动网络和评估网络。行动网络是根据当前的状态而决定下一个时刻施加到环境上去的最好动作。对于行动网络,强化学习算法允许它的输出结点进行随机搜索,有了来自评估网络的内部强化信号后,行动网络的输出结点即可有效地完成随机搜索并且大大地提高选择好的动作的

    作者: QGS
    417
    1
  • 深度学习】嘿马深度学习笔记第3篇:TensorFlow介绍,学习目标【附代码文档】

    本教程的知识点为:深度学习介绍 1.1 深度学习与机器学习的区别 TensorFlow介绍 2.4 张量 2.4.1 张量(Tensor) 2.4.1.1 张量的类型 TensorFlow介绍 1.2 神经网络基础 1.2.1 Logistic回归

    作者: 程序员一诺python
    发表时间: 2024-08-19 14:01:57
    80
    0
  • 强化学习(十二) Dueling DQN

      在强化学习(十一) Prioritized Replay DQN中,我们讨论了对DQN的经验回放池按权重采样来优化DQN算法的方法,本文讨论另一种优化方法,Dueling DQN。本章内容主要参考了ICML 2016的deep RL tutorial和Dueling

    作者: 格图洛书
    发表时间: 2021-12-29 15:24:28
    449
    0
  • 【干货分享】强化学习入门之旅

    望在这篇文章中为读者呈现出强化学习的真实面貌,让我们明白什么是强化学习能做的而且能出色完成的,而哪些又仅仅是停留在纸面上的假设而已。同时作者还认为机器学习中的一些重要问题将可以通过强化学习的角度予以解决。</align><align=left> 强化学习令人不解的原因主要在于它需

    作者: 小圆子
    13983
    3
  • 强化学习心得2

    一只熊;而强化学习输出的是当看到一只熊时要作出怎样的反应,是趴下装死还是赶紧跑路。对于一颗植物来说,对于植物现在时刻的状态选择浇水或者不浇水,都会以一定的概率得到植物的下一个状态。这就是强化学习。对于强化学习来说,有以下4个核心组成部分:强化学习四元组E = <S,A,P,R>s:state

    作者: xia1111
    1052
    1
  • 探索Python中的强化学习:DQN

    强化学习是一种机器学习方法,用于训练智能体(agent)在与环境的交互中学习如何做出最优决策。DQN(Deep Q-Network)是强化学习中的一种基于深度神经网络的方法,用于学习最优策略。本文将详细介绍DQN的原理、实现方式以及如何在Python中应用。 什么是DQN? D

    作者: Echo_Wish
    发表时间: 2024-04-01 08:55:17
    103
    0
  • 深度学习】嘿马深度学习笔记第2篇:TensorFlow介绍,学习目标【附代码文档】

    2.1 案例:xml读取本地文件存储到pkl 5.2.1.1 解析结构 全套笔记资料代码移步: https://gitee.com/yinuo112/AI/tree/master/深度学习/嘿马深度学习笔记/note.md 感兴趣的小伙伴可以自取哦~ 全套教程部分目录: 部分文件图片:

    作者: 程序员一诺python
    发表时间: 2024-08-17 18:38:27
    3
    0
  • 【OFDM通信】基于matlab深度学习OFDM系统信号检测【含Matlab源码 2023期】

    permute(ReceivedPacket,[2,3,1]); 三、运行结果 四、matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1] 高俊伟.基于深度学习的OFDM信号检测算法研究[D].哈尔滨工程大学 3 备注 简介此部分摘自互联网,仅供参考,若侵权,联系删除

    作者: 海神之光
    发表时间: 2022-08-08 15:35:50
    279
    0