已找到以下 10000 条记录。
  • 强化学习浅谈

    又学习策略。4. 强化学习的应用:游戏领域:AlphaGo和AlphaZero等强化学习在围棋、象棋等游戏中的成功应用,以及OpenAI的Dota 2项目。机器人控制:强化学习在机器人路径规划、操作控制等方面的应用,如机械臂控制、自主导航等。自动驾驶:强化学习可以用于自动驾驶系统

    作者: 运气男孩
    42
    1
  • 强化学习案例

    请问有大佬在modelarts上面进行强化学习训练和部署吗,希望能够学习交流一下。目前本小白在notebook上进行强化学习训练解决办法需要apt-get安装,但在modelarts的notebook中无apt-get安装的权限,请问各位大佬有什么好的方式去配置强化学习环境吗。如果能有案例学习将不胜感激。

    作者: 文新小白
    1567
    3
  • 强化学习应用

    强化学习应用为了更好地理解强化学习的组成部分,让我们考虑几个例子。Chess:这里的环境是棋盘,环境的状态是棋子在棋盘上的位置;RL 代理可以是参与者之一(或者,两个参与者都可以是 RL 代理,在同一环境中分别训练);一盘棋局则是一集。这一集从初始状态开始,黑板和白板的边缘排列着

    作者: QGS
    1276
    10
  • 什么是强化学习

    敌驻我扰,敌疲我打,敌退我追”,也是指导战争中的序列决策的; 当你总结完这些强化学习的概念后,觉得打仗这门学问就应该用强化学习来解决,倍感兴奋,但这只是强化学习相关的一些概念,怎么去做强化学习呢?这就引出下面两个重要的概念:Q值和V值 V值是智能体在某个状态下,一直到

    作者: yanghuaili
    发表时间: 2021-07-25 08:25:07
    2255
    0
  • 强化学习的落地实践

    强化学习被认为是实现通用人工智能的重要技术途径,本议题将围绕强化学习的发展历史,介绍强化学习背景,强化学习的最新研究进展,以及强化学习在业界的落地实践,并介绍该领域面临的挑战性问题和未来发展方向。

    主讲人:诺亚方舟实验室决策推理实验室主任 郝建业
    直播时间:2020/03/13 周五 16:20 - 17:20
  • 【转载】强化学习

    作者: andyleung
    714
    1
  • 什么叫做强化学习

    如题目描述的这样

    作者: qinggedada
    1543
    5
  • 【论文分享】基于深度强化学习的无人机自主部署及能效优化策略

    无人机需要根据复杂动态场景进行最优覆盖部署,同时要减少部署过程中的路径损耗和能量消耗。基于深度强化学习提出了无人机自主部署和能效优化策略,建立无人机覆盖状态集合,以能效作为奖励函数,利用深度神经网络和Q-learning引导无人机自主决策,部署最佳位置。仿真结果表明,该方法的部署

    作者: 乔天伊
    397
    19
  • 强化学习(十九) AlphaGo Zero强化学习原理

      在强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)中,我们讨论了MCTS的原理和在棋类中的基本应用。这里我们在前一节MCTS的基础上,讨论下DeepMind的AlphaGo Zero强化学习原理。     本篇主要参考了AlphaGo

    作者: 格图洛书
    发表时间: 2021-12-29 15:30:47
    517
    0
  • 深度学习模型预测 - 数据湖探索 DLI

    深度学习模型预测 深度学习已经广泛应用于图像分类、图像识别和语音识别等不同领域,DLI服务中提供了若干函数实现加载深度学习模型并进行预测的能力。 目前可支持的模型包括DeepLearning4j 模型和Keras模型。由于Keras它能够以 TensorFlow、CNTK或者 Theano

  • 【MindSpore易点通】强化学习系列之浅析强化学习基础

    多时候,我们可以取T=∞。强化学习的核心任务是,学习一个从状态空间S到动作空间A的映射,最大化累积受益。常用的强化学习算法有Q-Learning、策略梯度,以及演员评判家算法(Actor-Critic)等。4. 强化学习中的价值迭代上一章节已经把强化学习问题形式化为马尔可夫决策过

    作者: chengxiaoli
    1273
    0
  • 强化学习的特性

    强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学

    作者: 运气男孩
    552
    2
  • 强化学习预置算法

    Learning(强化学习预置算法)1. 概述该强化学习预置算法中,为用户提供了常用的强化学习算法,目前包括五个常用算法(DQN、PPO、A2C、IMPALA以及APEX)。用户订阅之后,选择算法只需设置对应参数,即可很方便地创建训练作业,开始训练相应的强化学习环境(内置环境或自

    作者: 大赛技术圈小助手
    517
    0
  • matlab代码注释技巧

    二、注释块操作:采用matlab块注释方法%{需要注释不执行的若干代码行(绿色显示)%} 三、判断语句操作:在注释段前面加一行:if ZHUSHI(0)在注释段后面加一行:end   这个方法通过逻辑判断语句决定是否执行相关的代码语句,因此相应的代码行颜色不会变成注释色——绿色。

    作者: liuzhen007
    发表时间: 2021-05-27 23:39:23
    1979
    0
  • 强化学习:原理与Python实现 》 —1.4 强化学习的分类

    1.4 强化学习的分类强化学习的任务和算法多种多样,本节介绍一些常见的分类(见图1-6)。图1-6 强化学习的分类1.4.1 按任务分类根据强化学习的任务和环境,可以将强化学习任务作以下分类。单智能体任务(single agent task)和多智能体任务(multi-agent

    作者: 华章计算机
    发表时间: 2019-11-12 12:18:30
    3300
    0
  • AI平台ModelArts资源

    AI平台ModelArts资源 AI平台ModelArts资源 面向开发者的一站式AI开发平台,可快速创建和部署模型,管理全周期AI工作流,助力千行百业智能升级 面向开发者的一站式AI开发平台,可快速创建和部署模型,管理全周期AI工作流,助力千行百业智能升级 购买 控制台 文档 资源与工具

  • 强化学习:原理与Python实现 》

    《科学》等权威期刊发表的多个深度强化学习明星算法。本书特色本书完整地介绍了主流的强化学习理论。全书采用完整的数学体系,各章内容循序渐进,严谨地讲授强化学习的理论基础,主要定理均给出证明过程。基于理论讲解强化学习算法,覆盖了所有主流强化学习算法,包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算

    作者: 华章计算机
    发表时间: 2019-11-12 01:57:45
    6062
    0
  • 强化学习相关问题

    强化学习使用帮助 https://bbs.huaweicloud.com/blogs/197300  https://bbs.huaweicloud.com/blogs/197302 强化学习预置算法 https://support.huaweicloud

    作者: 星月菩提
    发表时间: 2021-01-15 03:27:32
    1685
    0
  • 强化学习:原理与Python实现 》 —1.2 强化学习的应用

    1.2 强化学习的应用基于强化学习的人工智能已经有了许多成功的应用。本节将介绍强化学习的一些成功案例,让你更直观地理解强化学习,感受强化学习的强大。电动游戏:电动游戏,主要指玩家需要根据屏幕画面的内容进行操作的游戏,包括主机游戏吃豆人(PacMan,见图1-2)、PC游戏星际争霸

    作者: 华章计算机
    发表时间: 2019-11-12 12:15:36
    4508
    0
  • 会出强化学习框架么?

    【功能模块】华为会出基于MindSpore的强化学习框架么?

    作者: Big Liu
    1454
    4