搜索_华为云

已找到以下 10000 条记录

什么叫做强化学习
什么叫做强化学习

如题目描述的这样

开发者 > 其他

作者： qinggedada

1546

5
遗传算法与深度强化学习的主要差别是什么讨论下呢

遗传算法是随机束搜索的变形，与进化理论关联较强，其思想是个体种群内按一定概率交叉与变异产生下一代，去发现每一代及最终状态会如何变化，所以是关于群体进化的算法，对每个个体都有适应度函数进行评价，越好评价值就越高

开发者 > 其他

作者： AI爱好者

1988

5
强化学习(十九) AlphaGo Zero强化学习原理

　　在强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)中，我们讨论了MCTS的原理和在棋类中的基本应用。这里我们在前一节MCTS的基础上，讨论下DeepMind的AlphaGo Zero强化学习原理。　　　　本篇主要参考了AlphaGo

开发者 > 博客

作者：格图洛书

发表时间： 2021-12-29 15:30:47

517

0
强化学习中的深度卷积神经网络设计与应用实例

据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。 II. 深度卷积神经网络在强化学习中的角色 A. 提取高维度输入的特征在强化学习中，智能体通常需要处理高维度的输入，例如视频帧或图像。DCNNs能够自动提取这些高维度输入中的重

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-05-20 14:36:20

5

0
值分布强化学习
值分布强化学习

模型统计意义的人为规定。值分布强化学习方法是一类新兴的强化学习方法，达到了非分布式强化学习方法上新的基准性能，在 Atari 基准上超过了原有的基于期望的 value-based RL 方法。另外，也有研究人员发现了值分布强化学习与神经科学的内在联系。因此，值分布强化学习方法具有很高的研究价

开发者 > 其他

作者： yyy7124

1509

5
强化学习相关问题
强化学习相关问题

强化学习使用帮助 https://bbs.huaweicloud.com/blogs/197300 https://bbs.huaweicloud.com/blogs/197302 强化学习预置算法 https://support.huaweicloud.com/bestpra

开发者 > 博客

作者：星月菩提

发表时间： 2021-01-15 11:27:32

4979

0
强化学习算法选择
强化学习算法选择

强化学习算法选择在机器学习中，数据不同会导致算法表现不同。同样地，在强化学习中，由于目标环境的多样性，算法在不同环境中表现截然不同。另外，结合业务场景，开发者在其他维度（如算法输出动作的连续性或离散性、算法的学习效率等）上可能还有不同的要求。因此，选择合适的强化学习算法是一个很重

开发者 > 其他

作者：黄生

14

0
《强化学习：原理与Python实现》 —1.4　强化学习的分类

1.4　强化学习的分类强化学习的任务和算法多种多样，本节介绍一些常见的分类（见图1-6）。图1-6　强化学习的分类1.4.1　按任务分类根据强化学习的任务和环境，可以将强化学习任务作以下分类。单智能体任务（single agent task）和多智能体任务（multi-agent

开发者 > 博客

作者：华章计算机

发表时间： 2019-11-12 20:18:30

6835

0
会出强化学习框架么？
会出强化学习框架么？

【功能模块】华为会出基于MindSpore的强化学习框架么？

开发者 > 其他

作者： Big Liu

1455

4
强化学习 gameai
强化学习 gameai

求问大家有用过AI Gallery上的强化学习gameai吗，感觉用的人不是很多啊我试用了下训练一次有点小贵而且短时间训练不出啥结果主要是我自己也刚开始接触不是很懂这一块不知道大家都是如何学习的？

开发者 > 其他

作者： i淇淇子

5494

7
《强化学习：原理与Python实现》 —1.2　强化学习的应用

1.2　强化学习的应用基于强化学习的人工智能已经有了许多成功的应用。本节将介绍强化学习的一些成功案例，让你更直观地理解强化学习，感受强化学习的强大。电动游戏：电动游戏，主要指玩家需要根据屏幕画面的内容进行操作的游戏，包括主机游戏吃豆人（PacMan，见图1-2）、PC游戏星际争霸

开发者 > 博客

作者：华章计算机

发表时间： 2019-11-12 20:15:36

8091

0
【话题讨论】强化学习
【话题讨论】强化学习

状态空间大，且不稀疏的情形下，强化学习dqn方法的效果不好，大家都有哪些比较好的处理方法呢?欢迎大家讨论

开发者 > 其他

作者： xia1111

629

2
强化学习预置算法
强化学习预置算法

Learning（强化学习预置算法）1. 概述该强化学习预置算法中，为用户提供了常用的强化学习算法，目前包括五个常用算法（DQN、PPO、A2C、IMPALA以及APEX）。用户订阅之后，选择算法只需设置对应参数，即可很方便地创建训练作业，开始训练相应的强化学习环境（内置环境或自

开发者 > 其他

作者：大赛技术圈小助手

522

0
强化学习的落地实践

强化学习的落地实践

开发者 > 视频

播放量 1084
【云驻共创】机器学习、深度学习和强化学习的关系和区别是什么

境。强化学习的常见模型是标准的马尔可夫决策过程。按给定条件，强化学习可分为基于模式的强化学习和无模式强化学习。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数算法两类。深度学习模型可以在强化学习中得到使用，形成深度强化学习。

开发者 > 博客

作者：龙腾九州

发表时间： 2022-04-29 02:13:25

1497

0
【MindSpore易点通】强化学习系列之强化学习的探索和利用

解决无模型任务的样本复杂度大的问题，基于模型的深度强化学习对解决推荐系统的问题更为可靠。该推荐系统框架使用统一的极小化极大框架学习用户行为模型和相关的奖励函数，然后再利用用户行为模型学习深度强化学习策略博弈游戏：近年来，深度强化学习在游戏博弈的应用越来越广泛。特别适用于拥有巨大状

开发者 > 其他

作者： chengxiaoli

1059

1
【MindSpore易点通】强化学习系列之强化学习的基本求解方法(一)

1. 简介上一节主要介绍了强化学习的基本概念，主要是通过设定场景带入强化学习的策略、奖励、状态、价值进行介绍。有了基本的元素之后，就借助马尔可夫决策过程将强化学习的任务抽象出来，最后使用贝尔曼方程进行表述。本次内容主要是介绍强化学习的求解方法。也等同于优化贝尔曼方程。2. 贝尔曼

开发者 > 其他

作者： chengxiaoli

1353

0
【干货分享】强化学习入门之旅

望在这篇文章中为读者呈现出强化学习的真实面貌，让我们明白什么是强化学习能做的而且能出色完成的，而哪些又仅仅是停留在纸面上的假设而已。同时作者还认为机器学习中的一些重要问题将可以通过强化学习的角度予以解决。</align><align=left> 强化学习令人不解的原因主要在于它需

开发者 > 其他

作者：小圆子

13983

3
《强化学习：原理与Python实现》

《科学》等权威期刊发表的多个深度强化学习明星算法。本书特色本书完整地介绍了主流的强化学习理论。全书采用完整的数学体系，各章内容循序渐进，严谨地讲授强化学习的理论基础，主要定理均给出证明过程。基于理论讲解强化学习算法，覆盖了所有主流强化学习算法，包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算

开发者 > 博客

作者：华章计算机

发表时间： 2019-11-12 09:57:45

8106

0
强化学习（一）模型基础
强化学习（一）模型基础

　从今天开始整理强化学习领域的知识，主要参考的资料是Sutton的强化学习书和UCL强化学习的课程。这个系列大概准备写10到20篇，希望写完后自己的强化学习碎片化知识可以得到融会贯通，也希望可以帮到更多的人，毕竟目前系统的讲解强化学习的中文资料不太多。　　　　第一篇会从强化学习的基本概

开发者 > 博客

作者：格图洛书

发表时间： 2021-12-29 15:34:17

473

0

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么叫做强化学习

遗传算法与深度强化学习的主要差别是什么讨论下呢

强化学习(十九) AlphaGo Zero强化学习原理

强化学习中的深度卷积神经网络设计与应用实例

值分布强化学习

强化学习相关问题

强化学习算法选择

《强化学习：原理与Python实现》 —1.4　强化学习的分类

会出强化学习框架么？

强化学习 gameai

《强化学习：原理与Python实现》 —1.2　强化学习的应用

【话题讨论】强化学习

强化学习预置算法

强化学习的落地实践

【云驻共创】机器学习、深度学习和强化学习的关系和区别是什么

【MindSpore易点通】强化学习系列之强化学习的探索和利用

【MindSpore易点通】强化学习系列之强化学习的基本求解方法(一)

【干货分享】强化学习入门之旅

《强化学习：原理与Python实现》

强化学习（一）模型基础

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线