搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

MATLAB深度学习工具箱汇总
MATLAB深度学习工具箱汇总

Matlab一直以来都有着神经网络工具箱，而从2016的版本开始，提供深度神经网络的相关工具。而到现如今2017的版本，功能更加完善，因此本人在此总结Matlab 2017所包含的深度学习的功能。如今版本的Matlab已经包含的如下功能： Ø&n

开发者 > 博客

作者：格图洛书

发表时间： 2021-12-29 16:48:32

1073

0
【论文】强化学习必读经典论文 | 如何学习强化学习 | 强化学习入门

Christopher JCH Watkins and Peter Dayan. Q-learning. Machine learning, 8(3-4):279–292, 1992.Gerald Tesauro. Temporal difference learning and

开发者 > 博客

作者：王博Kings

发表时间： 2020-12-29 23:56:07

2476

0
【转载】强化学习
【转载】强化学习

开发者 > 其他

作者： andyleung

715

1
什么叫做强化学习
什么叫做强化学习

如题目描述的这样

开发者 > 其他

作者： qinggedada

1546

5
强化学习的落地实践
强化学习的落地实践

强化学习被认为是实现通用人工智能的重要技术途径，本议题将围绕强化学习的发展历史，介绍强化学习背景，强化学习的最新研究进展，以及强化学习在业界的落地实践，并介绍该领域面临的挑战性问题和未来发展方向。

开发者 > 直播

主讲人：诺亚方舟实验室决策推理实验室主任郝建业

直播时间：2020/03/13 周五 16:20 - 17:20
【云驻共创】机器学习、深度学习和强化学习的关系和区别是什么

境。强化学习的常见模型是标准的马尔可夫决策过程。按给定条件，强化学习可分为基于模式的强化学习和无模式强化学习。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数算法两类。深度学习模型可以在强化学习中得到使用，形成深度强化学习。

开发者 > 博客

作者：龙腾九州

发表时间： 2022-04-29 02:13:25

1497

0
《强化学习：原理与Python实现》 —1 初识强化学习

环境交互中趋利避害的学习过程称为强化学习。本章介绍人工智能领域中强化学习的基础知识，阐述强化学习的学习方法，并给出强化学习中智能体和环境交互的编程实例。1.1　强化学习及其关键元素在人工智能领域中，强化学习是一类特定的机器学习问题。在一个强化学习系统中，决策者可以观察环境，并根据

开发者 > 博客

作者：华章计算机

发表时间： 2019-11-12 20:13:54

6902

0
什么是强化学习？强化学习有哪些框架、算法、应用？

是总奖励关于策略参数的梯度。强化学习的应用强化学习在许多领域中都有着广泛的应用。下面介绍几个典型的应用场景。游戏AI 在游戏AI领域中，强化学习是一种非常有效的学习方式。例如，在AlphaGo和AlphaZero算法中，就采用了基于强化学习的方法来训练模型。这些算法能够在

开发者 > 博客

作者： wljslmz

发表时间： 2023-05-11 23:07:40

18

0
强化学习预置算法
强化学习预置算法

Learning（强化学习预置算法）1. 概述该强化学习预置算法中，为用户提供了常用的强化学习算法，目前包括五个常用算法（DQN、PPO、A2C、IMPALA以及APEX）。用户订阅之后，选择算法只需设置对应参数，即可很方便地创建训练作业，开始训练相应的强化学习环境（内置环境或自

开发者 > 其他

作者：大赛技术圈小助手

522

0
【论文分享】基于深度强化学习的无人机自主部署及能效优化策略

无人机需要根据复杂动态场景进行最优覆盖部署，同时要减少部署过程中的路径损耗和能量消耗。基于深度强化学习提出了无人机自主部署和能效优化策略，建立无人机覆盖状态集合，以能效作为奖励函数，利用深度神经网络和Q-learning引导无人机自主决策，部署最佳位置。仿真结果表明，该方法的部署

开发者 > 其他

作者：乔天伊

399

19
什么是强化学习？
什么是强化学习？

敌驻我扰，敌疲我打，敌退我追”，也是指导战争中的序列决策的；当你总结完这些强化学习的概念后，觉得打仗这门学问就应该用强化学习来解决，倍感兴奋，但这只是强化学习相关的一些概念，怎么去做强化学习呢？这就引出下面两个重要的概念：Q值和V值 V值是智能体在某个状态下，一直到

开发者 > 博客

作者： yanghuaili

发表时间： 2021-07-25 08:25:07

2255

0
《解锁元宇宙虚拟角色自主行为：AI与深度强化学习的融合变革》

决策。深度强化学习：实现自主决策的“学习引擎” 深度强化学习（DRL）作为机器学习的一个重要分支，为虚拟角色的自主行为决策提供了强大的学习机制。它结合了深度学习的强大表征能力和强化学习的试错学习机制，让虚拟角色能够在与环境的交互中不断学习和优化自己的行为策略。在深度强化学习中

开发者 > 博客

作者：程序员阿伟

发表时间： 2025-02-22 15:24:49

0

0
matlab代码注释技巧
matlab代码注释技巧

二、注释块操作：采用matlab块注释方法%{需要注释不执行的若干代码行（绿色显示）%} 三、判断语句操作：在注释段前面加一行：if ZHUSHI（0）在注释段后面加一行：end   这个方法通过逻辑判断语句决定是否执行相关的代码语句，因此相应的代码行颜色不会变成注释色——绿色。

开发者 > 博客

作者： liuzhen007

发表时间： 2021-05-27 23:39:23

1979

0
值分布强化学习
值分布强化学习

模型统计意义的人为规定。值分布强化学习方法是一类新兴的强化学习方法，达到了非分布式强化学习方法上新的基准性能，在 Atari 基准上超过了原有的基于期望的 value-based RL 方法。另外，也有研究人员发现了值分布强化学习与神经科学的内在联系。因此，值分布强化学习方法具有很高的研究价

开发者 > 其他

作者： yyy7124

1509

5
【AI理论】台湾大学李宏毅深度强化学习笔记(49PPT)

是监督式方法让机器去学习，就会变成你教授5-5后，第二手教机器下3-3，一步一步的带下法。但强化学习不一样，是到棋局结束才有奖励。阿法狗的算法则是，监督式先学习许多的棋谱，然后才用强化学习去探索更多棋谱跟走法。我们用语音机器人举例。一开始的监督则是从你一句我一句训练，然后根据动作

开发者 > 博客

作者： HWCloudAI

发表时间： 2019-08-06 20:18:08

5767

0
强化学习算法选择
强化学习算法选择

强化学习算法选择在机器学习中，数据不同会导致算法表现不同。同样地，在强化学习中，由于目标环境的多样性，算法在不同环境中表现截然不同。另外，结合业务场景，开发者在其他维度（如算法输出动作的连续性或离散性、算法的学习效率等）上可能还有不同的要求。因此，选择合适的强化学习算法是一个很重

开发者 > 其他

作者：黄生

15

0
【话题讨论】强化学习
【话题讨论】强化学习

状态空间大，且不稀疏的情形下，强化学习dqn方法的效果不好，大家都有哪些比较好的处理方法呢?欢迎大家讨论

开发者 > 其他

作者： xia1111

629

2
【MindSpore易点通】强化学习系列之浅析强化学习基础

多时候，我们可以取T=∞。强化学习的核心任务是，学习一个从状态空间S到动作空间A的映射，最大化累积受益。常用的强化学习算法有Q-Learning、策略梯度，以及演员评判家算法（Actor-Critic）等。4. 强化学习中的价值迭代上一章节已经把强化学习问题形式化为马尔可夫决策过

开发者 > 其他

作者： chengxiaoli

1273

0
强化学习的特性
强化学习的特性

强化学习是智能体（Agent）以“试错”的方式进行学习，通过与环境进行交互获得的奖赏指导行为，目标是使智能体获得最大的奖赏，强化学习不同于连接主义学习中的监督学习，主要表现在强化信号上，强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号)，而不是告诉强化学

开发者 > 其他

作者：运气男孩

553

2
一文读懂人工智能、机器学习、深度学习、强化学习的关系（必看）

数据预测。 5、人工智能强化学习（<<< 点开立即免费看）随着深度学习技术的流行，深度学习中的一些主流技术（如深度卷积神经网络、序列建模、记忆管理等）与强化学习在许多应用场景上出现了结合点，例如使用深度卷积网络来获取游戏画面的回放，然后结合强化学习本身的机制来训练出可以自己

开发者 > 博客

作者：牛油果

发表时间： 2019-02-15 10:44:46

12316

1

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消