搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

【问答官】深度学习代码如何进行单元测试

深度学习代码如何进行单元测试

开发者 > 其他

作者：芳菲菲兮满堂

1139

2
【深度学习】嘿马深度学习笔记第3篇：TensorFlow介绍,学习目标【附代码文档】

本教程的知识点为：深度学习介绍 1.1 深度学习与机器学习的区别 TensorFlow介绍 2.4 张量 2.4.1 张量(Tensor) 2.4.1.1 张量的类型 TensorFlow介绍 1.2 神经网络基础 1.2.1 Logistic回归

开发者 > 博客

作者：程序员一诺python

发表时间： 2024-08-19 14:01:57

80

0
深度强化学习应用落地即将迎来春天？

作者 | 杨鲤萍转自 | AI科技评论编辑 | 唐里深度强化学习（Deep Reinforcement Learning，DRL）一直是近年来人工智能的一些重大突破的核心。然而，尽管 DRL 有了很大的进步，但由于缺乏工具和库，DRL 方法在主流解决方案中仍然难以应用。因此，DRL

开发者 > 博客

作者：橘座

发表时间： 2019-11-02 08:23:38

3425

0
强化学习心得2
强化学习心得2

一只熊；而强化学习输出的是当看到一只熊时要作出怎样的反应，是趴下装死还是赶紧跑路。对于一颗植物来说，对于植物现在时刻的状态选择浇水或者不浇水，都会以一定的概率得到植物的下一个状态。这就是强化学习。对于强化学习来说，有以下4个核心组成部分：强化学习四元组E = <S,A,P,R>s：state

开发者 > 其他

作者： xia1111

1052

1
基于深度学习的鸟类识别系统matlab仿真

算法运行软件版本 matlab2022a   3.算法理论概述         鸟类识别是计算机视觉领域中的一个重要应用，它要求系统能够准确地从图像或视频中识别出鸟的种类。随着深度学习技术的发展，特别

开发者 > 博客

作者：简简单单做算法

发表时间： 2024-02-27 19:09:23

2

0
【MindSpore易点通】强化学习系列之强化学习的基本求解方法(一)

1. 简介上一节主要介绍了强化学习的基本概念，主要是通过设定场景带入强化学习的策略、奖励、状态、价值进行介绍。有了基本的元素之后，就借助马尔可夫决策过程将强化学习的任务抽象出来，最后使用贝尔曼方程进行表述。本次内容主要是介绍强化学习的求解方法。也等同于优化贝尔曼方程。2. 贝尔曼

开发者 > 其他

作者： chengxiaoli

1353

0
【深度学习】嘿马深度学习笔记第2篇：TensorFlow介绍,学习目标【附代码文档】

2.1 案例：xml读取本地文件存储到pkl 5.2.1.1 解析结构全套笔记资料代码移步： https://gitee.com/yinuo112/AI/tree/master/深度学习/嘿马深度学习笔记/note.md 感兴趣的小伙伴可以自取哦~ 全套教程部分目录：部分文件图片：

开发者 > 博客

作者：程序员一诺python

发表时间： 2024-08-17 18:38:27

3

0
探索Python中的强化学习：DQN
探索Python中的强化学习：DQN

强化学习是一种机器学习方法，用于训练智能体（agent）在与环境的交互中学习如何做出最优决策。DQN（Deep Q-Network）是强化学习中的一种基于深度神经网络的方法，用于学习最优策略。本文将详细介绍DQN的原理、实现方式以及如何在Python中应用。什么是DQN？ D

开发者 > 博客

作者： Echo_Wish

发表时间： 2024-04-01 08:55:17

103

0
强化学习(十二) Dueling DQN
强化学习(十二) Dueling DQN

　　在强化学习(十一) Prioritized Replay DQN中，我们讨论了对DQN的经验回放池按权重采样来优化DQN算法的方法，本文讨论另一种优化方法，Dueling DQN。本章内容主要参考了ICML 2016的deep RL tutorial和Dueling

开发者 > 博客

作者：格图洛书

发表时间： 2021-12-29 15:24:28

449

0
【干货分享】强化学习入门之旅

望在这篇文章中为读者呈现出强化学习的真实面貌，让我们明白什么是强化学习能做的而且能出色完成的，而哪些又仅仅是停留在纸面上的假设而已。同时作者还认为机器学习中的一些重要问题将可以通过强化学习的角度予以解决。</align><align=left> 强化学习令人不解的原因主要在于它需

开发者 > 其他

作者：小圆子

13983

3
深度学习之“深度”
深度学习之“深度”

深度学习是机器学习的一个分支领域：它是从数据中学习表示的一种新方法，强调从连续的层（layer）中进行学习，这些层对应于越来越有意义的表示。“深度学习”中的“深度”指的并不是利用这种方法所获取的更深层次的理解，而是指一系列连续的表示层。数据模型中包含多少层，这被称

开发者 > 其他

作者： ypr189

1569

1
强化学习从基础到进阶-案例与实践[4.2]：深度Q网络DQN-Cart pole游戏展示

强化学习从基础到进阶-案例与实践[4.2]：深度Q网络DQN-Cart pole游戏展示强化学习（Reinforcement learning，简称RL）是机器学习中的一个领域，区别与监督学习和无监督学习，强调如何基于环境而行动，以取得最大化的预期利益。基本操作步骤：智能

开发者 > 博客

作者：汀丶

发表时间： 2023-06-30 15:19:46

56

0
深度学习matlab图像分类，手把手教程

导出经过训练的网络和结果。深度网络设计器将经过训练的网络导出为变量 trainedNetwork_1，将训练信息导出为变量 trainInfoStruct_1。您也可以生成 MATLAB 代码，它可以重新创建所使用的网络和训练选项。在训练选项卡上，选择导出 > 生成训练代码。重命名一下

开发者 > 博客

作者：川川菜鸟

发表时间： 2021-10-10 16:08:01

2288

1
强化学习心得3
强化学习心得3

从SARSA到Q-learning对于智能体agent来说，要做的就是在环境中不断尝试而学习得到一个“策略”π，根据这个策略，在状态x下就能得知要执行的动作a = π(x)。图中的r即为状态动作的价值。通常我们使用Q表格来储存每一个状态下选择某一种动作所带来的价值。如上图所示通常

开发者 > 其他

作者： xia1111

1146

5
强化学习从基础到进阶-案例与实践[1]：强化学习概述、序列决策、动作空间定义、策略价值函数、探索与利用、Gym强化学习实验

1.3 强化学习的历史强化学习是有一定的历史的，早期的强化学习，我们称其为标准强化学习。最近业界把强化学习与深度学习结合起来，就形成了深度强化学习（deep reinforcemet learning），因此，深度强化学习 = 深度学习 + 强化学习。我们可将标准强化学习和深度强

开发者 > 博客

作者：汀丶

发表时间： 2023-06-19 11:07:20

10

0
深度残差收缩网络之Keras代码
深度残差收缩网络之Keras代码

深度残差网络首先，在介绍深度残差收缩网络的时候，经常需要从深度残差网络开始讲起。下图展示了深度残差网络的基本模块，包括一些非线性层（残差路径）和一个跨层的恒等连接。恒等连接是深度残差网络的核心，是其优异性能的一个保障。2.深度残差收缩网络深度残差收缩网络，就是对深度残差网络的残差路径进行收缩的一种网

开发者 > 博客

作者： hw9716

发表时间： 2020-01-13 14:45:17

2409

1
MindSpore AC算法强化学习
MindSpore AC算法强化学习

AC算法，也称为Actor-Critic算法，是强化学习中的一种重要方法。它结合了策略梯度方法和价值函数方法的优点，主要由两部分组成：演员（Actor）和评论家（Critic）。演员（Actor）：负责根据当前状态选择动作。通常采用策略函数 π(a|s) 来表示在给定状态

开发者 > 博客

作者： irrational

发表时间： 2024-06-04 12:17:36

11

0
强化学习从基础到进阶-案例与实践[4.1]：深度Q网络-DQN项目实战CartPole-v0

强化学习从基础到进阶-案例与实践[4.1]：深度Q网络-DQN项目实战CartPole-v0 1、定义算法相比于Q learning，DQN本质上是为了适应更为复杂的环境，并且经过不断的改良迭代，到了Nature DQN（即Volodymyr Mnih发表的Nature论文

开发者 > 博客

作者：汀丶

发表时间： 2023-06-24 23:55:51

156

0
强化学习实战-datawhale组队学习

先把代码clone一下。然后，就大概了解了一下，创建工作环境，展示变量之类。然后就是眼花缭乱的训练过程 python train.py

开发者 > 博客

作者： irrational

发表时间： 2022-08-22 14:53:24

162

0
使用Python实现强化学习算法
使用Python实现强化学习算法

当谈论强化学习时，我们在讨论一种机器学习方法，其目标是教会智能体（agent）在与环境的交互中学习最优的行为策略，以最大化累积奖励。在本文中，我们将介绍强化学习的基本概念，并使用 Python 和 OpenAI 的 Gym 库来实现一个简单的强化学习算法：Q-learning。

开发者 > 博客

作者： Echo_Wish

发表时间： 2024-04-26 08:54:34

61

0

总条数： 10000

上一页
1
...
5
6
7
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

【问答官】深度学习代码如何进行单元测试

【深度学习】嘿马深度学习笔记第3篇：TensorFlow介绍,学习目标【附代码文档】

深度强化学习应用落地即将迎来春天？

强化学习心得2

基于深度学习的鸟类识别系统matlab仿真

【MindSpore易点通】强化学习系列之强化学习的基本求解方法(一)

【深度学习】嘿马深度学习笔记第2篇：TensorFlow介绍,学习目标【附代码文档】

探索Python中的强化学习：DQN

强化学习(十二) Dueling DQN

【干货分享】强化学习入门之旅

深度学习之“深度”

强化学习从基础到进阶-案例与实践[4.2]：深度Q网络DQN-Cart pole游戏展示

深度学习matlab图像分类，手把手教程

强化学习心得3

强化学习从基础到进阶-案例与实践[1]：强化学习概述、序列决策、动作空间定义、策略价值函数、探索与利用、Gym强化学习实验

深度残差收缩网络之Keras代码

MindSpore AC算法强化学习

强化学习从基础到进阶-案例与实践[4.1]：深度Q网络-DQN项目实战CartPole-v0

强化学习实战-datawhale组队学习

使用Python实现强化学习算法

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线