内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 什么是强化学习

    敌驻我扰,敌疲我打,敌退我追”,也是指导战争中的序列决策的; 当你总结完这些强化学习的概念后,觉得打仗这门学问就应该用强化学习来解决,倍感兴奋,但这只是强化学习相关的一些概念,怎么去做强化学习呢?这就引出下面两个重要的概念:Q值和V值 V值是智能体在某个状态下,一直到

    作者: yanghuaili
    发表时间: 2021-07-25 08:25:07
    2255
    0
  • matlab代码注释技巧

    二、注释块操作:采用matlab块注释方法%{需要注释不执行的若干代码行(绿色显示)%} 三、判断语句操作:在注释段前面加一行:if ZHUSHI(0)在注释段后面加一行:end   这个方法通过逻辑判断语句决定是否执行相关的代码语句,因此相应的代码行颜色不会变成注释色——绿色。

    作者: liuzhen007
    发表时间: 2021-05-27 23:39:23
    1979
    0
  • 【转载】强化学习

    作者: andyleung
    715
    1
  • 什么叫做强化学习

    如题目描述的这样

    作者: qinggedada
    1546
    5
  • 【论文分享】基于深度强化学习的无人机自主部署及能效优化策略

    无人机需要根据复杂动态场景进行最优覆盖部署,同时要减少部署过程中的路径损耗和能量消耗。基于深度强化学习提出了无人机自主部署和能效优化策略,建立无人机覆盖状态集合,以能效作为奖励函数,利用深度神经网络和Q-learning引导无人机自主决策,部署最佳位置。仿真结果表明,该方法的部署

    作者: 乔天伊
    397
    19
  • 会出强化学习框架么?

    【功能模块】华为会出基于MindSpore的强化学习框架么?

    作者: Big Liu
    1454
    4
  • 强化学习(十九) AlphaGo Zero强化学习原理

      在强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)中,我们讨论了MCTS的原理和在棋类中的基本应用。这里我们在前一节MCTS的基础上,讨论下DeepMind的AlphaGo Zero强化学习原理。     本篇主要参考了AlphaGo

    作者: 格图洛书
    发表时间: 2021-12-29 15:30:47
    517
    0
  • 强化学习:原理与Python实现 》

    《科学》等权威期刊发表的多个深度强化学习明星算法。本书特色本书完整地介绍了主流的强化学习理论。全书采用完整的数学体系,各章内容循序渐进,严谨地讲授强化学习的理论基础,主要定理均给出证明过程。基于理论讲解强化学习算法,覆盖了所有主流强化学习算法,包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算

    作者: 华章计算机
    发表时间: 2019-11-12 09:57:45
    8106
    0
  • 强化学习 gameai

    求问大家有用过AI Gallery上的强化学习gameai吗,感觉用的人不是很多啊  我试用了下 训练一次有点小贵 而且短时间训练不出啥结果 主要是我自己也刚开始接触 不是很懂这一块 不知道大家都是如何学习的?

    作者: i淇淇子
    5493
    7
  • 强化学习相关问题

    强化学习使用帮助 https://bbs.huaweicloud.com/blogs/197300  https://bbs.huaweicloud.com/blogs/197302 强化学习预置算法 https://support.huaweicloud

    作者: 星月菩提
    发表时间: 2021-01-15 03:27:32
    1685
    0
  • 强化学习:原理与Python实现 》 —1.2 强化学习的应用

    1.2 强化学习的应用基于强化学习的人工智能已经有了许多成功的应用。本节将介绍强化学习的一些成功案例,让你更直观地理解强化学习,感受强化学习的强大。电动游戏:电动游戏,主要指玩家需要根据屏幕画面的内容进行操作的游戏,包括主机游戏吃豆人(PacMan,见图1-2)、PC游戏星际争霸

    作者: 华章计算机
    发表时间: 2019-11-12 20:15:36
    8091
    0
  • 强化学习预置算法

    Learning(强化学习预置算法)1. 概述该强化学习预置算法中,为用户提供了常用的强化学习算法,目前包括五个常用算法(DQN、PPO、A2C、IMPALA以及APEX)。用户订阅之后,选择算法只需设置对应参数,即可很方便地创建训练作业,开始训练相应的强化学习环境(内置环境或自

    作者: 大赛技术圈小助手
    518
    0
  • 基于深度学习的性别识别算法matlab仿真

    视觉领域的一个重要研究方向,旨在通过图像或视频中的人脸信息来自动判断性别。近年来,随着深度学习技术的不断发展,基于深度神经网络的性别识别方法取得了显著的进步。GoogLeNet作为一种经典的深度学习模型,在图像分类任务上取得了优异的成绩。本文将详细介绍如何基于GoogLeNet构建高效的性别识别算法。

    作者: 简简单单做算法
    发表时间: 2024-02-18 23:25:20
    6
    0
  • 强化学习:原理与Python实现 》 —1.4 强化学习的分类

    1.4 强化学习的分类强化学习的任务和算法多种多样,本节介绍一些常见的分类(见图1-6)。图1-6 强化学习的分类1.4.1 按任务分类根据强化学习的任务和环境,可以将强化学习任务作以下分类。单智能体任务(single agent task)和多智能体任务(multi-agent

    作者: 华章计算机
    发表时间: 2019-11-12 20:18:30
    6835
    0
  • Matlab:序列分析法MATLAB代码

    Matlab:序列分析法MATLAB代码     目录 输出结果 设计代码       输出结果 更新……   设计代码 ###下面所有带代码中的n值需要以自己输入的数据为准### 1、简单一次滑动平均法预测MATLAB程序代码 y=[_______];

    作者: 一个处女座的程序猿
    发表时间: 2021-03-27 18:39:24
    1565
    0
  • [ 转载 ] 六节课入门「深度强化学习」,UC伯克利教授Pieter Abbeel开课了

    将传统强化学习深度神经网络结合的深度强化学习,一直以来被视为更接近人类思维方式的人工智能方法。深度学习具备强感知能力但缺乏一定的决策能力,强化学习具备决策能力但对感知问题束手无策,因此将两者结合起来可以达到优势互补的效果,为复杂系统的感知决策问题提供了解决思路。 想要入门深度强化

    作者: MKT 黄不正
    4111
    5
  • 值分布强化学习

    模型统计意义的人为规定。值分布强化学习方法是一类新兴的强化学习方法,达到了非分布式强化学习方法上新的基准性能,在 Atari 基准上超过了原有的基于期望的 value-based RL 方法。另外,也有研究人员发现了值分布强化学习与神经科学的内在联系。因此,值分布强化学习方法具有很高的研究价

    作者: yyy7124
    1507
    5
  • 强化学习算法选择

    强化学习算法选择在机器学习中,数据不同会导致算法表现不同。同样地,在强化学习中,由于目标环境的多样性,算法在不同环境中表现截然不同。另外,结合业务场景,开发者在其他维度(如算法输出动作的连续性或离散性、算法的学习效率等)上可能还有不同的要求。因此,选择合适的强化学习算法是一个很重

    作者: 黄生
    14
    0
  • 【AAAI2020】强化学习玩王者荣耀

    Controlin MOBA Games with DeepReinforcement Learning 主要贡献 提出了一个深度强化学习框架,从系统和算法的角度来解决这个问题。提出的算法包括几种新颖的策略,包括control dependency decoupling,action

    作者: 小小谢先生
    发表时间: 2022-04-15 18:04:28
    572
    0