搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

深度学习+迁移学习+强化学习的区别分享

进行迁移学习的方法；三. 强化学习：强化学习：全称是 Deep Reinforcement Learning（DRL），让机器有了自我学习、自我思考的能力。目前强化学习主要用在游戏 AI 领域，最出名的应该算AlphaGo的围棋大战。强化学习是个复杂的命题，Deepmind

开发者 > 博客

作者：简单坚持

发表时间： 2020-09-21 12:21:27

10848

0
优化油藏生产决策的深度强化学习算法

结论通过深度强化学习算法，我们可以优化油藏生产决策，提高油田的产量和经济效益。这种方法可以适应复杂的油藏环境和不确定性，并学习最优的生产策略。随着人工智能技术的不断发展，深度强化学习在油田勘探和生产中的应用前景将更加广阔。请注意，以上示例代码仅为演示深度强化学习在优化油藏生

开发者 > 博客

作者：皮牙子抓饭

发表时间： 2023-06-30 18:10:39

5

0
深度开发智慧路灯应用 - 代码示例

基于物联网平台、ECS、软件开发服务，通过数据转发和订阅推送两种方式，搭建智慧路灯应用。

开发者 > 开发工具
深度开发智慧路灯应用 - 代码示例

基于物联网平台、ECS、软件开发服务，通过数据转发和订阅推送两种方式，搭建智慧路灯应用。

开发者 > 开发工具
深度强化学习在自动驾驶中的应用与挑战

如环境建模的复杂性、计算资源的消耗以及安全性问题等。本文将深入探讨深度强化学习在自动驾驶中的应用和挑战，并结合代码实例展示如何应用DRL进行简单的自动驾驶决策。1. 深度强化学习简介1.1 强化学习概述强化学习（Reinforcement Learning, RL）是一种使智能

开发者 > 其他

作者：柠檬味拥抱

81

4
强化学习(十六) 深度确定性策略梯度(DDPG)

　　在强化学习(十五) A3C中，我们讨论了使用多线程的方法来解决Actor-Critic难收敛的问题，今天我们不使用多线程，而是使用和DDQN类似的方法：即经验回放和双网络的方法来改进Actor-Critic难收敛的问题，这个算法就是是深度确定性策略梯度(Deep

开发者 > 博客

作者：格图洛书

发表时间： 2021-12-29 17:25:14

506

0
深度学习项目代码阅读建议
深度学习项目代码阅读建议

的项目代码，阅读方法肯定会有所区别。因为我们读代码的目的、场景和对象不尽相同，下面笔者从三个方面来和大家探讨如何阅读一份深度学习项目代码。首先读代码的一些通用方法。这一点而言不局限于深度学习项目代码，任何项目、任何语言的代码阅读都适用。我们日常读代码无非是

开发者 > 其他

作者： @Wu

967

1
【论文分享】基于深度强化学习的物联网智能路由策略

选择问题中，路由器剩余缓存大小的可能情况很多，使得直接应用传统强化学习方式不能很好地解决路由选择问题。因此，本文将通过结合深度强化学习来解决由于数据量增多引起的网络堵塞概率过高问题。目前，尚没有其他方法采用深度强化学习来解决路由问题。2 结束语本文针对由于物联网以及未来大数据时代

开发者 > 其他

作者：乔天伊

350

14
PyTorch深度学习实战 | 自然语言处理与强化学习

利益的习惯性行为。强化学习的应用范围非常广泛，各领域对它的研究重点各有不同，本篇中我们只专注于强化学习的通用概念！ ■ 图1 强化学习、监督学习、非监督学习关系示意图在实际应用中，人们常常会把强化学习、监督学习和非监督学习这三者混淆，为了更深刻地理解强化学习和它们之间的区别，首先介绍监督学习和非监督学习的概念。

开发者 > 博客

作者： TiAmoZhang

发表时间： 2023-03-16 08:20:28

735

0
【论文分享】基于深度强化学习的智能车间调度方法研究

提出了一种基于深度强化学习的车间调度算法。通过分析模型在不同参数设置下的收敛性，确定了最优参数。在不同规模的公共数据集和实际生产数据集上的实验结果表明，所提出的深度强化学习算法能够取得更好的性能。关键词：工业物联网 ; 智能车间调度 ; 柔性生产 ; 深度强化学习 ; 车间调度方法0

开发者 > 其他

作者：乔天伊

728

13
【强化学习】gym简介
【强化学习】gym简介

44454647484950 2022.4.10更程序代码 Q学习实际上就是离轨策略的时序差分(TD)方法，相关的理论看参考本专栏的这篇博文【强化学习】迷宫寻宝：Sarsa和Q-Learning 完整代码： import gym import numpy as np

开发者 > 博客

作者： zstar

发表时间： 2022-08-05 17:14:27

178

0
使用深度强化学习进行自动测井井段划分

种基于深度强化学习的自动测井井段划分方法，它能够帮助我们提高效率和准确性。在深度强化学习中，我们将使用一种称为深度强化学习网络（Deep Reinforcement Learning Network）的模型来进行自动测井井段划分。该网络由两个主要组件组成：一个是强化学习智能体（Reinforcement

开发者 > 博客

作者：皮牙子抓饭

发表时间： 2023-06-07 15:30:17

20

0
探索基于深度强化学习的石油炼化过程优化方法

奖励函数定义：定义奖励函数，根据炼厂的目标，如最小化能源消耗、最大化生产效率等。构建深度强化学习模型：使用深度强化学习算法，如深度Q网络（DQN），构建一个能够根据当前状态选择最优动作的模型。模型训练：使用收集到的数据对深度强化学习模型进行训练，通过与环境的交互，模型可以学习到最优的策略来优化石油炼化过程。

开发者 > 博客

作者：皮牙子抓饭

发表时间： 2023-06-30 21:49:39

6

0
MATLAB深度学习 2019
MATLAB深度学习 2019

开发者 > 博客

作者： tsinghuazhuoqing

发表时间： 2021-12-25 17:27:45

612

0
深度强化学习中的深度神经网络优化策略：挑战与解决方案

I. 引言深度强化学习（Deep Reinforcement Learning，DRL）结合了强化学习（Reinforcement Learning，RL）和深度学习（Deep Learning）的优点，使得智能体能够在复杂的环境中学习最优策略。随着深度神经网络（Deep Neural

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-05-20 14:35:59

5

0
基于深度强化学习的石油炼化过程智能优化策略

技术应用与优化基于深度强化学习的石油炼化过程智能优化策略包括以下几个关键步骤：环境建模：将石油炼化过程中的环境状态进行建模，包括温度、压力、催化剂投入量等参数。可以使用神经网络等模型对环境进行建模，将环境状态作为输入。强化学习智能体建模：建立一个强化学习智能体，将环境状态作

开发者 > 博客

作者：皮牙子抓饭

发表时间： 2023-07-02 11:10:50

9

0
将强化学习引入NLP：原理、技术和代码实现

前的对话内容。每次回复都基于当前的对话状态，并影响后续的对话流程。 3.3 深度强化学习深度强化学习结合了深度学习和强化学习，使用神经网络来估计价值函数或策略。概念在深度强化学习中，智能体使用深度神经网络来处理输入的状态，并输出一个动作或动作的概率分布。通过训练，神经网络可以从大量的交互中学习到有效的策略。

开发者 > 博客

作者： TechLead

发表时间： 2023-11-05 09:25:00

20

0
遗传算法与深度强化学习的主要差别是什么讨论下呢

遗传算法是随机束搜索的变形，与进化理论关联较强，其思想是个体种群内按一定概率交叉与变异产生下一代，去发现每一代及最终状态会如何变化，所以是关于群体进化的算法，对每个个体都有适应度函数进行评价，越好评价值就越高

开发者 > 其他

作者： AI爱好者

1989

5
强化学习(十七) 基于模型的强化学习与Dyna算法框架

　在前面我们讨论了基于价值的强化学习(Value Based RL)和基于策略的强化学习模型(Policy Based RL)，本篇我们讨论最后一种强化学习流派，基于模型的强化学习(Model Based RL)，以及基于模型的强化学习算法框架Dyna。　　　　本篇主要参考了UCL强化学习课程的第8讲和Dyna-2的论文。

开发者 > 博客

作者：格图洛书

发表时间： 2021-12-29 17:03:57

349

0
强化学习：基于蒙特卡洛树和策略价值网络的深度强化学习五子棋

实现了基于蒙特卡洛树和策略价值网络的深度强化学习五子棋(含码源) 特点自我对弈详细注释流程简单代码结构 net：策略价值网络实现 mcts：蒙特卡洛树实现 server：前端界面代码 legacy：废弃代码 docs：其他文件 utils：工具代码 network.py：移植过来的网络结构代码

开发者 > 博客

作者：汀丶

发表时间： 2023-07-15 23:19:22

9

0

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消