内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • MATLAB深度学习工具箱汇总

    Matlab一直以来都有着神经网络工具箱,而从2016的版本开始,提供深度神经网络的相关工具。而到现如今2017的版本,功能更加完善,因此本人在此总结Matlab 2017所包含的深度学习的功能。 如今版本的Matlab已经包含的如下功能: Ø&n

    作者: 格图洛书
    发表时间: 2021-12-29 16:48:32
    1073
    0
  • 浅谈强化学习

    RL)和被动强化学习(passive RL)。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数(value function)算法两类。深度学习可以在强化学习中得到使用,形成深度强化学习强化学习理论受到行为

    作者: QGS
    68
    1
  • 强化学习

    过程中自主学习,这称为强化学习(reinforcement learning)。强化学习和有“教师”在身边教的“监督学习”有所不同。强化学习的基本框架是,代理(Agent)根据环境选择行动,然后通过这个行动改变环境。根据环境的变化,代理获得某种报酬。强化学习的目的是决定代理的行动

    作者: G-washington
    1671
    1
  • 强化学习介绍

    强化学习 (Reinforcement Learning) 是一个机器学习大家族中的分支, 由于近些年来的技术突破, 和深度学习 (Deep Learning) 的整合, 使得强化学习有了进一步的运用. 比如让计算机学着玩游戏, AlphaGo 挑战世界围棋高手, 都是强化学习在行的事

    作者: 角动量
    1756
    2
  • 强化学习:原理与Python实现 》 —1.5 如何学习强化学习

    如AlphaGo使用的算法,都是深度强化学习算法。本书第2章介绍Markov决策过程,第3章到第9章介绍Markov决策问题的求解,其中也涵盖了大多经典的深度强化学习算法。在强化学习的学习和实际应用中,难免需要通过编程来实现强化学习算法。强化学习算法需要运行在环境中。Python

    作者: 华章计算机
    发表时间: 2019-11-12 12:33:04
    2306
    0
  • 一文读懂人工智能、机器学习、深度学习、强化学习的关系(必看)

    工智能强化学习 (<<< 点开立即免费看)  随着深度学习技术的流行,深度学习中的一些主流技术(如深度卷积神经网络、序列建模、记忆管理等)与强化学习在许多应用场景上出现了结合点,例如使用深度卷积网络来获取游戏画面的回放,然后结合强化学习本身的

    作者: 牛油果
    发表时间: 2019-02-15 02:44:46
    8886
    1
  • 深度学习】嘿马深度学习笔记第1篇:深度学习基本概要【附代码文档】

    掌握神经网络图像相关案例 深度学习介绍 1.1 深度学习与机器学习的区别 学习目标 目标 知道深度学习与机器学习的区别 应用 无 1.1.1 区别 1.1.1.1 特征提取方面 机器学习的特征工程步骤是要靠手动完成的,而且需要大量领域专业知识 深度学习通常由多个层组

    作者: 程序员一诺python
    发表时间: 2024-08-16 17:03:45
    22
    0
  • 【论文】强化学习必读经典论文 | 如何学习强化学习 | 强化学习入门

    Christopher JCH Watkins and Peter Dayan. Q-learning. Machine learning, 8(3-4):279–292, 1992.Gerald Tesauro. Temporal difference learning

    作者: 王博Kings
    发表时间: 2020-12-29 15:56:07
    1230
    0
  • 【AI理论】台湾大学李宏毅深度强化学习笔记(49PPT)

    是监督式方法让机器去学习,就会变成你教授5-5后,第二手教机器下3-3,一步一步的带下法。但强化学习不一样,是到棋局结束才有奖励。阿法狗的算法则是,监督式先学习许多的棋谱,然后才用强化学习去探索更多棋谱跟走法。我们用语音机器人举例。一开始的监督则是从你一句我一句训练,然后根据动作

    作者: HWCloudAI
    发表时间: 2019-08-06 12:18:08
    4001
    0
  • 基于Qlearning强化学习的路径规划算法matlab仿真

    算法运行软件版本 MATLAB2022A     3.算法理论概述         路径规划在机器人、自动驾驶等领域中具有重要应用。Q-learning是一种经典的强化学习算法,可以用于解决

    作者: 简简单单做算法
    发表时间: 2023-10-10 23:27:00
    68
    0
  • 【论文分享】基于深度强化学习的无人机数据采集和路径规划研究

    传感器网络数据采集时的路径规划问题进行了研究,同时满足无人机自身因电池容量有限而产生的充电需求。具体地,利用时间抽象分层强化学习思想,基于离散动作深度强化学习架构,提出了一种新颖的option-DQN(option-deep Q-learning)算法,实现了高效的无人机数据采集

    作者: 乔天伊
    460
    2
  • 强化学习:原理与Python实现 》 —1 初识强化学习

    环境交互中趋利避害的学习过程称为强化学习。本章介绍人工智能领域中强化学习的基础知识,阐述强化学习的学习方法,并给出强化学习中智能体和环境交互的编程实例。1.1 强化学习及其关键元素在人工智能领域中,强化学习是一类特定的机器学习问题。在一个强化学习系统中,决策者可以观察环境,并根据

    作者: 华章计算机
    发表时间: 2019-11-12 12:13:54
    3427
    0
  • 什么是强化学习强化学习有哪些框架、算法、应用?

    是总奖励关于策略参数的梯度。 强化学习的应用 强化学习在许多领域中都有着广泛的应用。下面介绍几个典型的应用场景。 游戏AI 在游戏AI领域中,强化学习是一种非常有效的学习方式。例如,在AlphaGo和AlphaZero算法中,就采用了基于强化学习的方法来训练模型。这些算法能够在

    作者: wljslmz
    发表时间: 2023-05-11 23:07:40
    18
    0
  • 强化学习浅谈

    又学习策略。4. 强化学习的应用:游戏领域:AlphaGo和AlphaZero等强化学习在围棋、象棋等游戏中的成功应用,以及OpenAI的Dota 2项目。机器人控制:强化学习在机器人路径规划、操作控制等方面的应用,如机械臂控制、自主导航等。自动驾驶:强化学习可以用于自动驾驶系统

    作者: 运气男孩
    42
    1
  • 强化学习案例

    请问有大佬在modelarts上面进行强化学习训练和部署吗,希望能够学习交流一下。目前本小白在notebook上进行强化学习训练解决办法需要apt-get安装,但在modelarts的notebook中无apt-get安装的权限,请问各位大佬有什么好的方式去配置强化学习环境吗。如果能有案例学习将不胜感激。

    作者: 文新小白
    1567
    3
  • 强化学习应用

    强化学习应用为了更好地理解强化学习的组成部分,让我们考虑几个例子。Chess:这里的环境是棋盘,环境的状态是棋子在棋盘上的位置;RL 代理可以是参与者之一(或者,两个参与者都可以是 RL 代理,在同一环境中分别训练);一盘棋局则是一集。这一集从初始状态开始,黑板和白板的边缘排列着

    作者: QGS
    1276
    10
  • 什么是强化学习

    敌驻我扰,敌疲我打,敌退我追”,也是指导战争中的序列决策的; 当你总结完这些强化学习的概念后,觉得打仗这门学问就应该用强化学习来解决,倍感兴奋,但这只是强化学习相关的一些概念,怎么去做强化学习呢?这就引出下面两个重要的概念:Q值和V值 V值是智能体在某个状态下,一直到

    作者: yanghuaili
    发表时间: 2021-07-25 08:25:07
    2255
    0
  • 强化学习的落地实践

    强化学习被认为是实现通用人工智能的重要技术途径,本议题将围绕强化学习的发展历史,介绍强化学习背景,强化学习的最新研究进展,以及强化学习在业界的落地实践,并介绍该领域面临的挑战性问题和未来发展方向。

    主讲人:诺亚方舟实验室决策推理实验室主任 郝建业
    直播时间:2020/03/13 周五 16:20 - 17:20
  • 【转载】强化学习

    作者: andyleung
    714
    1
  • 什么叫做强化学习

    如题目描述的这样

    作者: qinggedada
    1543
    5