搜索_华为云

已找到以下 10000 条记录

AI平台ModelArts

ModelArts是面向开发者的一站式AI开发平台，为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成，及端-边-云模型按需部署能力，帮助用户快速创建和部署模型，管理全周期AI工作流。

购买控制台文档

AI平台ModelArts

购买 AI Gallery 1对1咨询

深度强化学习
深度强化学习

深度强化学习是人工智能最有趣的分支之一。它是人工智能社区许多显着成就的基石，它在棋盘、视频游戏、自动驾驶、机器人硬件设计等领域击败了人类冠军。深度强化学习利用深度神经网络的学习能力，可以解决对于经典强化学习（RL）技术来说过于复杂的问题。深度强化学习比机器学习的其他分支要复杂得多

开发者 > 其他

作者： QGS

465

1
【强化学习基础】深度强化学习介绍

本篇文章是博主强化学习RL领域学习时，用于个人学习、研究或者欣赏使用，并基于博主对相关等领域的一些理解而记录的学习摘录和笔记，若有不当和侵权之处，指出后将会立即改正，还望谅解。文章强化学习：强化学习（2）---《【DRL】深度强化学习介绍》【DRL】深度强化学习介绍目录

开发者 > 博客

作者：不去幼儿园

发表时间： 2024-12-02 20:12:31

9

0
深度强化学习：原理、算法与应用

态的价值：其中，( delta_t ) 是时序差分误差：深度强化学习的应用深度强化学习已经在多个领域取得了显著的成果，尤其是在需要复杂决策的任务中。以下是一些深度强化学习的经典应用： 1. 游戏AI 深度强化学习最为人熟知的应用之一是在游戏领域，特别是在电子游戏中。2015

开发者 > 博客

作者：远方2.0

发表时间： 2024-11-30 20:51:40

33

0
深度强化学习入门介绍
深度强化学习入门介绍

来测试自己的强化学习程序。在本课程中，您将通过使用 Tensorflow 和 PyTorch 来训练能玩太空入侵者、Minecraft、星际争霸、刺猬索尼克等游戏的聪明的智能体。在第一章中，您将学习到深度强化学习的基础知识。在训练深度强化学习智能体之前，掌握这些深度学习的基础知识非常重要。让我们开始吧！一

开发者 > 其他

作者：可爱又积极

1186

1
17 种深度强化学习算法的 Pytorch 实现

来源：github转自：新智元编辑：肖琴深度强化学习已经在许多领域取得了瞩目的成就，并且仍是各大领域受热捧的方向之一。本文推荐一个用PyTorch实现了17种深度强化学习算法的教程和代码库，帮助大家在实践中理解深度RL算法。深度强化学习已经在许多领域取得了瞩目的成就，并且仍是各大

开发者 > 博客

作者：橘座

发表时间： 2019-11-02 16:40:10

3951

0
强化学习和深度学习的结合
强化学习和深度学习的结合

无监督学习和半监督学习及强化学习。图像、文本等深度学习的应用都属于有监督学习范畴。自编码器和生成式对抗网络可以算在无监督深度学习范畴内。最后就剩下强化学习了。强化学习发展到现在，早已结合了神经网络迸发出新的活力，强化学习结合深度学习已经形成了深度强化学习（Deep Reinforcement

开发者 > 其他

作者：黄生

48

2
深度强化学习模型优化算法综述

文将综述深度强化学习模型优化算法的发展及其在实际应用中的应用情况。 I. 引言深度强化学习模型的优化算法是指在训练深度神经网络的同时，结合强化学习框架，使智能体能够从环境中学习到最优策略。优化算法的选择直接影响了模型的性能和训练效率。本文将介绍几种主流的深度强化学习模型优化算

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-05-20 14:44:53

5

0
为什么是深度强化学习？
为什么是深度强化学习？

的最佳轨迹。强化学习还需要评估状态-动作对的轨迹；这比监督学习所要面对的，每个训练示例与其预期结果配对问题更难学习。这种复杂性增加了深度强化学习模型的数据要求。但与监督学习不同，深度强化学习模型在训练期间收集数据，而监督学习需要人工提前策划和准备训练数据。深度强化学习和通用人工智能AI

开发者 > 其他

作者： QGS

923

5
【论文分享】基于深度强化学习的无人机数据采集和路径规划研究

集时的路径规划问题进行了研究，同时满足无人机自身因电池容量有限而产生的充电需求。具体地，利用时间抽象分层强化学习思想，基于离散动作深度强化学习架构，提出了一种新颖的option-DQN（option-deep Q-learning）算法，实现了高效的无人机数据采集和路径规划，同时

开发者 > 其他

作者：乔天伊

460

2
深度学习算法中的深度强化学习（Deep Reinforcement Learning）

决这一问题，引入了深度强化学习（Deep Reinforcement Learning）的概念。本文将介绍深度强化学习的基本概念、算法原理以及在实际应用中的一些案例。深度强化学习的基本概念深度强化学习是将深度学习与强化学习相结合的一种方法。在深度强化学习中，智能体通过与环

开发者 > 博客

作者：皮牙子抓饭

发表时间： 2023-09-26 09:17:02

67

1
强化学习算法中深度强化学习（Deep Reinforcement Learning）

如在游戏领域中，AlphaGo使用了深度强化学习算法来击败人类围棋冠军，DeepMind的DQN在Atari游戏上取得了超人水平的表现。此外，深度强化学习还被应用于机器人控制、自动驾驶等领域。总而言之，深度强化学习是一种结合深度学习和强化学习的算法，通过使用神经网络来近似值函数

开发者 > 博客

作者：皮牙子抓饭

发表时间： 2023-08-30 09:04:33

4

0
深度学习模型优化
深度学习模型优化

遇见你，遇见未来华为云 | +智能，见未来项目实习生深度学习模型优化深度学习模型优化领域方向：人工智能工作地点：深圳深度学习模型优化人工智能深圳项目简介为AI类应用深度学习模型研发优化技术，包括神经网络结构设计，NAS搜索算法，训练算法优化，AI模型编译优化等

其他
强化学习算法工程师
强化学习算法工程师

博士招聘强化学习算法工程师强化学习算法工程师领域方向：AI 工作地点：深圳、北京、杭州、西安强化学习算法工程师 AI 深圳、北京、杭州、西安岗位职责 1、负责华为云人工智能服务的强化学习算法的设计和实现，负责业界领先相关技术分析； 2、负责华为云人工智能服务强化学习框架搭

其他
多智能体深度强化学习：综述
多智能体深度强化学习：综述

体领域已被其单智能体领域所遮盖，但多智能体强化学习获得了快速发展的动力，最新成果解决了现实世界中的复杂性问题。本文概述了多智能体深度强化学习领域的最新发展。主要关注近年来的文献，这些文献结合了深度强化学习方法和多智能体方案。主要内容分为三个部分。首先，分析了用于训练多个特工的训练

开发者 > 其他

作者：可爱又积极

1225

0
强化学习如何运用到车辆路径规划（VRP）

车辆路径规划问题（Vehicle Routing Problem，VRP）是运筹学领域十分经典的0-1整数规划问题。近几十年来已经有众多学者通过启发式以及一些精确算法对该问题进行了全面且深入的研究。但值得注意的是，该问题的众多特性也十分适用于使用机器学习、强化学习等方法进行求解，例如Hao

开发者 > 其他

作者： xia1111

3067

3
【MADRL】多智能体深度强化学习《纲要》

本篇文章是博主强化学习RL领域学习时，用于个人学习、研究或者欣赏使用，并基于博主对相关等领域的一些理解而记录的学习摘录和笔记，若有不当和侵权之处，指出后将会立即改正，还望谅解。文章强化学习：强化学习（3）---《【MADRL】多智能体深度强化学习《纲要》》【MADRL】多智能体深度强化学习《纲要》

开发者 > 博客

作者：不去幼儿园

发表时间： 2024-12-20 11:02:31

267

0
强化学习如何运用到车辆路径规划（VRP）

强化学习如何运用到车辆路径规划（VRP）车辆路径规划问题（Vehicle Routing Problem，VRP）是运筹学领域十分经典的0-1整数规划问题。近几十年来已经有众多学者通过启发式以及一些精确算法对该问题进行了全面且深入的研究。但值得注意的是，该问题的众多特性也十分

开发者 > 博客

作者： xia1111

发表时间： 2020-12-30 22:52:59

14103

0
利用深度强化学习优化钻井过程

控制钻井液的密度，影响井壁稳定性通过调整这些关键参数，深度强化学习可以根据地层特征和钻井目标来优化钻井过程，提高钻井效率和质量。深度强化学习的训练过程深度强化学习的训练过程通常分为离线训练和在线优化两个阶段。在离线训练阶段，我们可以利用历史钻井数据来训练深度强化学习模型。通过建立状态、动作和奖励

开发者 > 博客

作者：皮牙子抓饭

发表时间： 2023-06-30 17:08:33

5

0
组合优化算法中的人工智能方法及其应用研究

大多数优化算法涉及的默认参数和策略都是专家经验设定，但根据NFL理论，针对一个具体的优化算法，不可能只依赖于一套参数和策略高效解决所有场景的问题，因此需要基于问题特征、算法特点和实际要求来适配合适的参数和策略，此问题的解决需要基于学习的方法来解决，但基于学习的方法（例如机器学习、强化学习方法

其他
各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

各个模型深度学习训练加速框架的选择 LlamaFactory框架使用两种训练框架： DeepSpeed和Accelerate都是针对深度学习训练加速的工具，但是它们的实现方式和应用场景有所不同。 DeepSpeed是一种深度学习加速框架，主要针对大规模模型和大规模数据集的训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
【强化学习】gym简介
【强化学习】gym简介

gym可以理解为一个仿真环境，里面内置了多种仿真游戏。比如，出租车游戏、悬崖游戏。不同的游戏所用的网格、规则、奖励(reward)都不一样，适合为强化学习做测试。同时，其提供了页面渲染，可以可视化地查看效果。安装gym pip install gym 1 gym的常用函数解释生成仿真环境

开发者 > 博客

作者： zstar

发表时间： 2022-08-05 17:14:27

178

0
REPAINT:深度强化学习中的知识迁移

过利用先前学习的任务来加速复杂任务的学习过程一直是强化学习中最具挑战性的问题之一，尤其是当源任务和目标任务之间的相似性较低时。本文针对深度强化学习中的知识迁移问题，提出了表示与实例迁移(REPAINT)算法。REPAINT 不仅在策略学习中转移了预先训练的教师策略的表示，而且还使

开发者 > 其他

作者：可爱又积极

651

1
算法创新Lab_研究方向_强化学习虚机调度论文发表

请您在新打开的页面绑定邮箱！注意: 绑定邮箱完成前，请不要关闭此窗口！已完成绑定 RL4VM论文被顶级期刊Pattern Recognition接收，用强化学习求解虚拟机调度问题随着云计算的飞速发展，大规模动态虚拟机调度的重要性日益提高。在动态虚拟机调度过程中，最困难的问题在于其随机性，即创建

其他

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

AI平台ModelArts

深度强化学习

【强化学习基础】深度强化学习介绍

深度强化学习：原理、算法与应用

深度强化学习入门介绍

17 种深度强化学习算法的 Pytorch 实现

强化学习和深度学习的结合

深度强化学习模型优化算法综述

为什么是深度强化学习？

【论文分享】基于深度强化学习的无人机数据采集和路径规划研究

深度学习算法中的深度强化学习（Deep Reinforcement Learning）

强化学习算法中深度强化学习（Deep Reinforcement Learning）

深度学习模型优化

强化学习算法工程师

多智能体深度强化学习：综述

强化学习如何运用到车辆路径规划（VRP）

【MADRL】多智能体深度强化学习《纲要》

强化学习如何运用到车辆路径规划（VRP）

利用深度强化学习优化钻井过程

组合优化算法中的人工智能方法及其应用研究

各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

【强化学习】gym简介

REPAINT:深度强化学习中的知识迁移

算法创新Lab_研究方向_强化学习虚机调度论文发表

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线