已找到以下 10000 条记录。
  • 强化学习 gameai

    求问大家有用过AI Gallery上的强化学习gameai吗,感觉用的人不是很多啊  我试用了下 训练一次有点小贵 而且短时间训练不出啥结果 主要是我自己也刚开始接触 不是很懂这一块 不知道大家都是如何学习的?

    作者: i淇淇子
    5493
    7
  • 值分布强化学习

    模型统计意义的人为规定。值分布强化学习方法是一类新兴的强化学习方法,达到了非分布式强化学习方法上新的基准性能,在 Atari 基准上超过了原有的基于期望的 value-based RL 方法。另外,也有研究人员发现了值分布强化学习与神经科学的内在联系。因此,值分布强化学习方法具有很高的研究价

    作者: yyy7124
    1503
    5
  • 强化学习:原理与Python实现 》 —1.2 强化学习的应用

    1.2 强化学习的应用基于强化学习的人工智能已经有了许多成功的应用。本节将介绍强化学习的一些成功案例,让你更直观地理解强化学习,感受强化学习的强大。电动游戏:电动游戏,主要指玩家需要根据屏幕画面的内容进行操作的游戏,包括主机游戏吃豆人(PacMan,见图1-2)、PC游戏星际争霸

    作者: 华章计算机
    发表时间: 2019-11-12 12:15:36
    4508
    0
  • 强化学习算法选择

    强化学习算法选择在机器学习中,数据不同会导致算法表现不同。同样地,在强化学习中,由于目标环境的多样性,算法在不同环境中表现截然不同。另外,结合业务场景,开发者在其他维度(如算法输出动作的连续性或离散性、算法的学习效率等)上可能还有不同的要求。因此,选择合适的强化学习算法是一个很重

    作者: 黄生
    14
    0
  • 【话题讨论】强化学习

    状态空间大,且不稀疏的情形下,强化学习dqn方法的效果不好,大家都有哪些比较好的处理方法呢?欢迎大家讨论

    作者: xia1111
    624
    2
  • 基于深度学习的性别识别算法matlab仿真

    视觉领域的一个重要研究方向,旨在通过图像或视频中的人脸信息来自动判断性别。近年来,随着深度学习技术的不断发展,基于深度神经网络的性别识别方法取得了显著的进步。GoogLeNet作为一种经典的深度学习模型,在图像分类任务上取得了优异的成绩。本文将详细介绍如何基于GoogLeNet构建高效的性别识别算法。

    作者: 简简单单做算法
    发表时间: 2024-02-18 23:25:20
    6
    0
  • 【AAAI2020】强化学习玩王者荣耀

    Controlin MOBA Games with DeepReinforcement Learning 主要贡献 提出了一个深度强化学习框架,从系统和算法的角度来解决这个问题。提出的算法包括几种新颖的策略,包括control dependency decoupling,action

    作者: 小小谢先生
    发表时间: 2022-04-15 18:04:28
    572
    0
  • Matlab:序列分析法MATLAB代码

    Matlab:序列分析法MATLAB代码     目录 输出结果 设计代码       输出结果 更新……   设计代码 ###下面所有带代码中的n值需要以自己输入的数据为准### 1、简单一次滑动平均法预测MATLAB程序代码 y=[_______];

    作者: 一个处女座的程序猿
    发表时间: 2021-03-27 18:39:24
    1565
    0
  • 【高并发】深度解析ScheduledThreadPoolExecutor类的源代码

    在【高并发专题】的专栏中,我们深度分析了ThreadPoolExecutor类的源代码,而ScheduledThreadPoolExecutor类是ThreadPoolExecutor类的子类。今天我们就来一起手撕ScheduledThreadPoolExecutor类的源代码。 构造方法

    作者: 冰 河
    发表时间: 2022-10-24 02:10:40
    564
    0
  • 【MindSpore易点通】强化学习系列之强化学习的探索和利用

    解决无模型任务的样本复杂度大的问题,基于模型的深度强化学习对解决推荐系统的问题更为可靠。该推荐系统框架使用统一的极小化极大框架学习用户行为模型和相关的奖励函数,然后再利用用户行为模型学习深度强化学习策略博弈游戏:近年来,深度强化学习在游戏博弈的应用越来越广泛。特别适用于拥有巨大状

    作者: chengxiaoli
    1058
    1
  • 《Keras深度学习实战》—3.5 示例通用代码

    3.5 示例通用代码以下代码可用于所有优化示例,我们导入与优化相关的类:

    作者: 华章计算机
    发表时间: 2019-06-15 05:30:30
    2172
    0
  • 【高并发】深度解析ScheduledThreadPoolExecutor类的源代码

    在【高并发专题】的专栏中,我们深度分析了ThreadPoolExecutor类的源代码,而ScheduledThreadPoolExecutor类是ThreadPoolExecutor类的子类。今天我们就来一起手撕ScheduledThreadPoolExecutor类的源代码。 构造方法

    作者: 冰 河
    发表时间: 2021-09-25 13:19:31
    2346
    0
  • 强化学习算法中SARSA

    这使得SARSA算法更适合于处理连续决策问题,如强化学习中的马尔可夫决策过程(Markov Decision Process)。 总之,SARSA是一种基于状态-动作-奖励-下一个状态-下一个动作的模式进行学习和决策的强化学习算法。它通过差分更新的方式逐步调整状态-动作对的价值

    作者: 皮牙子抓饭
    发表时间: 2023-08-29 09:12:54
    5
    0
  • 强化学习心得4

    Q-learning算法,算法步骤如下所示:引用《introduction to reinforcement learning》一书中的伪代码如下所示:两者的区别在于而Sarsa在每一步中以e-greedy的策略选取下一个状态动作值函数,而Q-learning在每一步TD中贪心的

    作者: xia1111
    848
    3
  • 深度残差收缩网络:(六)代码实现

    evaluate(testX, testY)[0]上面的代码构建了一个小型的深度残差收缩网络,只含有3个基本残差收缩模块,其他的超参数也未进行优化。如果为了追求更高的准确率的话,可以适当增加深度,增加训练迭代次数,以及适当调整超参数。前五篇的内容:深度残差收缩网络:(一)背景知识 https://www

    作者: hw9826
    发表时间: 2020-01-14 14:05:46
    1878
    0
  • [ 转载 ] 六节课入门「深度强化学习」,UC伯克利教授Pieter Abbeel开课了

    将传统强化学习深度神经网络结合的深度强化学习,一直以来被视为更接近人类思维方式的人工智能方法。深度学习具备强感知能力但缺乏一定的决策能力,强化学习具备决策能力但对感知问题束手无策,因此将两者结合起来可以达到优势互补的效果,为复杂系统的感知决策问题提供了解决思路。 想要入门深度强化

    作者: MKT 黄不正
    4111
    5
  • 通过记忆的元强化学习

    尽管现代深度强化学习(RL)算法处于人工智能能力的前沿,但通常需要大量的训练样本才能达到与人类相当的性能水平。这种严重的数据效率低下是深度RL实际应用的主要障碍: 在没有模拟器的情况下,几乎不可能将深度RL应用到任何领域。为了解决这一关键的数据低效问题,在本文中,我们致力于设计能

    作者: 可爱又积极
    843
    2
  • 使用强化学习内置环境

    05/10/214611s75kapmgyvyjhb7n.png) #### 进入AI Gallery订阅强化学习算法 ModelArts预置的强化学习算法(名为“强化学习预置算法”)发布在AI Gallery中。您可以前往AI Gallery,订阅此模型,然后同步至ModelArts中。

    作者: 运气男孩
    924
    1
  • 强化学习(一)模型基础

     从今天开始整理强化学习领域的知识,主要参考的资料是Sutton的强化学习书和UCL强化学习的课程。这个系列大概准备写10到20篇,希望写完后自己的强化学习碎片化知识可以得到融会贯通,也希望可以帮到更多的人,毕竟目前系统的讲解强化学习的中文资料不太多。     第一篇会从强化学习的基本概

    作者: 格图洛书
    发表时间: 2021-12-29 15:34:17
    473
    0