搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

【一周AI资讯】20211112：深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

涵盖了深度强化学习和多智能体深度强化学习两⼤领域近100种探索算法。总的来说，该综述的贡献主要可以总结为以下四⽅⾯：三类探索算法。该综述⾸次提出基于⽅法性质的分类⽅法，根据⽅法性质把探索算法主要分为基于不确定性的探索、基于内在激励的探索和其他三⼤类，并从单智能体深度强化学习和多智

开发者 > 其他

作者： chengxiaoli

2802

0
使用Python实现强化学习算法
使用Python实现强化学习算法

当谈论强化学习时，我们在讨论一种机器学习方法，其目标是教会智能体（agent）在与环境的交互中学习最优的行为策略，以最大化累积奖励。在本文中，我们将介绍强化学习的基本概念，并使用 Python 和 OpenAI 的 Gym 库来实现一个简单的强化学习算法：Q-learning。

开发者 > 博客

作者： Echo_Wish

发表时间： 2024-04-26 08:54:34

61

0
李飞飞提出深度进化强化学习新框架：创建具身智能体学会动物进化法则

复杂的任务。研究人员称，AI智能体也可以很快学会动物的这种智能行为，但目前推动具身认知面临很多挑战。最近斯坦福李飞飞教授等人的研究「深度进化强化学习」有了突破，首次证明了「鲍德温效应」。智能体/代理（Agents）是人工智能领域的一个主要研究课题，分为非具身智能和具身智能。而

开发者 > 博客

作者： HWCloudAI

发表时间： 2021-02-18 08:23:42

3449

1
《深度强化学习原理与实践》作者陈仲铭、何明将图书首印稿费捐助公益项目

性应用（如AlphaGo）。此外，本书还深度剖析了强化学习各算法之间的联系，有助于读者举一反三。本书分为四篇：初探强化学习、求解强化学习、求解强化学习进阶和深度强化学习。涉及基础理论到深度强化学习算法框架的各方面内容，反映了深度强化学习领域过去的发展历程和最新的研究进展，有助于

开发者 > 博客

作者： SUNSKY

发表时间： 2019-09-02 14:35:38

6883

0
ModelArts使用强化学习内置环境
ModelArts使用强化学习内置环境

05/10/214611s75kapmgyvyjhb7n.png) #### 进入AI Gallery订阅强化学习算法 ModelArts预置的强化学习算法（名为“强化学习预置算法”）发布在AI Gallery中。您可以前往AI Gallery，订阅此模型，然后同步至ModelArts中。

开发者 > 其他

作者：运气男孩

1457

3
强化学习论文阅读笔记：RODE
强化学习论文阅读笔记：RODE

Roles to Decompose Multi-Agent Tasks 链接：https://arxiv.org/abs/2010.01523 代码：https://github.com/TonghanWang/RODE 01摘要 RODE所解决的问题是多智能体学习过程中动作-状态空间

开发者 > 其他

作者： yyy7124

1100

3
基于强化学习的推荐研究综述
基于强化学习的推荐研究综述

分析了强化学习对推荐系统的提升思路,对近年来基于强化学习的推荐研究进行了梳理与总结,并分别对传统强化学习推荐和深度强化学习推荐的研究情况进行总结;在此基础上,重点总结了近年来强化学习推荐研究的若干前沿,以及其应用研究情况。最后,对强化学习在推荐系统中应用的未来发展趋势进行分析与展望。http://www

开发者 > 其他

作者：可爱又积极

1334

5
ModelAr使用强化学习内置环境
ModelAr使用强化学习内置环境

05/10/214611s75kapmgyvyjhb7n.png) #### 进入AI Gallery订阅强化学习算法 ModelArts预置的强化学习算法（名为“强化学习预置算法”）发布在AI Gallery中。您可以前往AI Gallery，订阅此模型，然后同步至ModelArts中。

开发者 > 其他

作者：运气男孩

525

1
【MindSpore易点通】强化学习系列之强化学习的基本求解方法(二)

不管这条路会有多危险。而Sarsa则是相当保守,他会选择规避特殊情况，达到目的是次要的，首先要保障安全性，这就是使用Sarsa方法的不同之处。参考文献[1] 陈雷.深度学习与MindSpore实践[M].清华大学出版社：2020.[2] 诸葛越，葫芦娃.百面机器学习[M].人民邮电出版社：2020.

开发者 > 其他

作者： chengxiaoli

1253

0
强化学习-云机器人
强化学习-云机器人

强化学习是智能体（Agent）以“试错”的方式进行学习，通过与环境进行交互获得的奖赏指导行为，目标是使智能体获得最大的奖赏，强化学习不同于连接主义学习中的监督学习，主要表现在强化信号上，强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号)，而不是告诉强化学

开发者 > 其他

作者： QGS

840

3
在线matlab代码学习神器Octave Online

Save the data in MATLAB’s v7 binary data format. -V6 -v6 -6 -mat -mat-binary Save the data in MATLAB’s v6 binary data format

开发者 > 博客

作者： zhangrelay

发表时间： 2021-07-14 19:33:44

1489

0
基于强化学习的推荐研究综述
基于强化学习的推荐研究综述

分析了强化学习对推荐系统的提升思路,对近年来基于强化学习的推荐研究进行了梳理与总结,并分别对传统强化学习推荐和深度强化学习推荐的研究情况进行总结;在此基础上,重点总结了近年来强化学习推荐研究的若干前沿,以及其应用研究情况。最后,对强化学习在推荐系统中应用的未来发展趋势进行分析与展望。http://www

开发者 > 其他

作者：可爱又积极

1057

3
强化学习的使用范围是什么？
强化学习的使用范围是什么？

尽管我们在机器学习社区中广泛使用强化学习，但强化学习不仅仅是一个人工智能术语，它是许多领域中的一个中心思想，如下图（强化学习的多个方面，Many Faces of Reinforcement Learning）所示。事实上，许多这些领域面临着与机器学习相同的问题：如何优化决策以实现最佳结果，这就是决策科学

开发者 > 其他

作者：极客潇

1484

2
MindSpore强化强化学习：使用mindrl

安装MindRL pip install https://ms-release.obs.cn-north-4.myhuaweicloud.com/2.1.0/Reinforcement/x86_64/mindspore_rl-0.7.0-py3-none-linux_x86_64

开发者 > 博客

作者： irrational

发表时间： 2024-04-14 18:34:15

1328

0
强化学习游戏训练框架ASED
强化学习游戏训练框架ASED

json说明env_config.py说明game_interface.py说明Benchmark实验数据5. 更多信息强化学习入门课程案例使用强化学习AlphaZero算法训练中国象棋AI与中国象棋AI对战！使用强化学习AlphaZero算法训练五子棋AI使用DQN算法玩2048游戏使用PPO算法玩超级马里奥

开发者 > 其他

作者：开发者创新中心小广播

682

0
深度学习 - 深度学习（人工神经网络的研究的概念）

文章目录深度学习 - 深度学习（人工神经网络的研究的概念）1、概念2、相关应用场景3、简介4、区别于浅层学习5、典型模型案例6、深度学习是如何进行训练的自下上升的非监督学习自顶向下的监督学习深度学习 - 深度学习（人工神经网络的研究的概念）

开发者 > 博客

作者：简简单单Onlinezuozuo

发表时间： 2022-02-18 15:08:32

608

0
强化学习基本模型和原理
强化学习基本模型和原理

强化学习是从动物学习、参数扰动自适应控制等理论发展而来，其基本原理是：如果Agent的某个行为策略导致环境正的奖赏(强化信号)，那么Agent以后产生这个行为策略的趋势便会加强。Agent的目标是在每个离散状态发现最优策略以使期望的折扣奖赏和最大。强化学习把学习看作试探评价过程，

开发者 > 其他

作者： QGS

727

1
强化学习（十）Double DQN (DDQN)
强化学习（十）Double DQN (DDQN)

/reinforcement-learning/ddqn.py 　　　　这里我们重点关注DDQN和上一节的Nature DQN的代码的不同之处。代码只有一个地方不一样，就是计算目标Q值的时候，如下： # Step 2: calculate y y_batch

开发者 > 博客

作者：格图洛书

发表时间： 2021-12-29 16:11:29

931

0
【深度学习】嘿马深度学习笔记第7篇：卷积神经网络,学习目标【附代码文档】

5.2.1 案例：xml读取本地文件存储到pkl 5.2.1.1 解析结构完整笔记资料代码：https://gitee.com/yinuo112/AI/tree/master/深度学习/嘿马深度学习笔记/note.md 感兴趣的小伙伴可以自取哦~ 全套教程部分目录：部分文件图片：

开发者 > 博客

作者：程序员一诺python

发表时间： 2024-09-04 12:32:12

0

0
【深度学习】嘿马深度学习笔记第8篇：卷积神经网络,学习目标【附代码文档】

5.2.1 案例：xml读取本地文件存储到pkl 5.2.1.1 解析结构完整笔记资料代码：https://gitee.com/yinuo112/AI/tree/master/深度学习/嘿马深度学习笔记/note.md 感兴趣的小伙伴可以自取哦~ 全套教程部分目录：部分文件图片：

开发者 > 博客

作者：程序员一诺python

发表时间： 2024-09-08 21:34:37

0

0

总条数： 10000

上一页
1
...
6
7
8
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

【一周AI资讯】20211112：深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

使用Python实现强化学习算法

李飞飞提出深度进化强化学习新框架：创建具身智能体学会动物进化法则

《深度强化学习原理与实践》作者陈仲铭、何明将图书首印稿费捐助公益项目

ModelArts使用强化学习内置环境

强化学习论文阅读笔记：RODE

基于强化学习的推荐研究综述

ModelAr使用强化学习内置环境

【MindSpore易点通】强化学习系列之强化学习的基本求解方法(二)

强化学习-云机器人

在线matlab代码学习神器Octave Online

基于强化学习的推荐研究综述

强化学习的使用范围是什么？

MindSpore强化强化学习：使用mindrl

强化学习游戏训练框架ASED

深度学习 - 深度学习（人工神经网络的研究的概念）

强化学习基本模型和原理

强化学习（十）Double DQN (DDQN)

【深度学习】嘿马深度学习笔记第7篇：卷积神经网络,学习目标【附代码文档】

【深度学习】嘿马深度学习笔记第8篇：卷积神经网络,学习目标【附代码文档】

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线