搜索_华为云

已找到以下 10000 条记录

强化学习（十）Double DQN (DDQN)
强化学习（十）Double DQN (DDQN)

/reinforcement-learning/ddqn.py 　　　　这里我们重点关注DDQN和上一节的Nature DQN的代码的不同之处。代码只有一个地方不一样，就是计算目标Q值的时候，如下： # Step 2: calculate y y_batch

开发者 > 博客

作者：格图洛书

发表时间： 2021-12-29 16:11:29

931

0
深度学习matlab图像分类，手把手教程

导出经过训练的网络和结果。深度网络设计器将经过训练的网络导出为变量 trainedNetwork_1，将训练信息导出为变量 trainInfoStruct_1。您也可以生成 MATLAB 代码，它可以重新创建所使用的网络和训练选项。在训练选项卡上，选择导出 > 生成训练代码。重命名一下

开发者 > 博客

作者：川川菜鸟

发表时间： 2021-10-10 16:08:01

2288

1
D-Plan AI 生态伙伴计划
D-Plan AI 生态伙伴计划

D-Plan AI 生态伙伴计划 D-Plan AI 生态伙伴计划 D-Plan AI 生态伙伴计划是围绕华为云一站式AI开发平台ModelArts推出的一项合作伙伴计划，旨在与合作伙伴一起构建合作共赢的AI生态体系，加速AI应用落地，华为云向伙伴提供培训、技术、营销和销售的全面支持。

产品
迎接“深度用云”时代
迎接“深度用云”时代

善。下一篇：赋能政企深度用云，释放数字生产力本期杂志杂志推荐第16期下载目录迎接“深度用云”时代赋能政企深度用云，释放数字生产力构筑行业云底座，共创行业新价值站在2023起跑线，政企数字化如何深入“核心地带” 华为云，助力他们“深度用云” 南京：瞄准超大城市治理，向智慧要韧性

其他
MATLAB与深度学习构建神经网络的实用指南

频），在复杂任务上表现出色。MATLAB正在不断扩展其支持，以便用户能够构建多模态深度学习模型。总结本文提供了一份实用指南，介绍了如何在MATLAB中构建深度学习模型。以下是主要内容的概述：深度学习基础：介绍了深度学习的概念以及MATLAB深度学习工具箱的优势。通过示例

开发者 > 博客

作者：柠檬味拥抱1

发表时间： 2025-01-26 00:54:26

106

0
华为云hilens
华为云hilens

模型训练，得到模型后，根据需要部署的设备芯片类型，完成对应的模型转换。 AI应用开发开发者可以选择基于ModelBox框架进行推理阶段的代码开发，完成后可以打包为RPM包或镜像，也可以直接将算法打包为镜像，即可通过HiLens平台将算法在线部署到已注册的设备上运行。建议搭配使用

产品
深度解析 OpenCV 边界填充：方法、应用与实战代码详解

加丰富。代码运行效果如下9. 边界填充技术的最新研究与发展边界填充技术不仅在传统图像处理领域发挥着重要作用，在深度学习、增强现实（AR）、虚拟现实（VR）等前沿领域也有广泛的应用。随着这些技术的发展，边界填充方法也在不断进化，以适应更加复杂和多样的应用场景。9.1 深度学习中的边

开发者 > 其他

作者：柠檬味拥抱1

324

6
代码审计服务
代码审计服务

Java 语言源代码漏洞测试规范、GB/T34946-2017 C#语言源代码漏洞测试规范。针对应用程序源代码，从结构、脆弱性以及缺陷等方面进行审查，以发现当前应用程序中存在的缺陷以及代码的规范性缺陷。审核目的:本次源代码审计工作是通过对当前系统各模块的源代码进行审查，以检查代码在程序编

云商店

商家: 山东新潮信息技术有限公司

交付方式: 人工服务
强化学习(十一) Prioritized Replay DQN

　　在强化学习（十）Double DQN (DDQN)中，我们讲到了DDQN使用两个Q网络，用当前Q网络计算最大Q值对应的动作，用目标Q网络计算这个最大动作对应的目标Q值，进而消除贪婪法带来的偏差。今天我们在DDQN的基础上，对经验回放部

开发者 > 博客

作者：格图洛书

发表时间： 2021-12-29 17:49:11

522

0
分享IMPALA：大规模强化学习算法

论文名称：Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures作者：Lasse Espeholt / Hubert Soyer / Remi Munos / Karen Simonyan

开发者 > 其他

作者：初学者7000

1366

4
强化学习AI的未来发展
强化学习AI的未来发展

随着人工智能技术的不断发展，强化学习成为了一个备受关注的热门领域。作为一项能够让机器模仿人类决策过程的技术，强化学习在日常生活中得到了广泛的应用。在这篇文章中，我们将探讨强化学习AI的未来发展，在未来的数年中，我们有望看到它成为AI技术的主要引擎之一。强化学习是一种让机器通过学习来达

开发者 > 博客

作者：赵KK日常技术记录

发表时间： 2023-06-25 18:01:06

12

0
深度诊断ECS - 弹性云服务器 ECS

登录管理控制台，进入弹性云服务器列表页面。在待深度诊断的ECS的“操作”列，单击“更多 > 运维与监控 > 深度诊断”。（可选）在“开通云运维中心并添加权限”页面，阅读服务声明并勾选后，单击“开通并授权”。若当前账号未开通并授权COC服务，则会显示该页面。在“深度诊断”页面，选择“深度诊断场景”为“全面诊断”。

帮助中心 > 弹性云服务器 ECS > 用户指南 > 自助运维管理
基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型 - CodeArts IDE Online

基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型概要准备工作导入和预处理训练数据集创建和训练模型使用模型

 帮助中心 > CodeArts IDE Online > 最佳实践
AI市场强化学习预置算法实践----使用强化学习训练智能体玩转Atari小游戏（1）

表一篇工作，将深度学习运用到强化学习任务上。随着算法改进，DeepMind的研究者使用DQN（Deep Q Network）进行Atari游戏，有接近一半的游戏上，智能体水平都超过的了人类。本篇博客，就教你使用ModelArts的AI市场上强化学习预置算法，0代码训练一个可以玩A

开发者 > 博客

作者：灰灰爱喝粥

发表时间： 2020-09-12 17:28:33

9191

0
强化学习组合优化综述论文
强化学习组合优化综述论文

工构造的启发式算法，这些启发式算法能够依次地构造解决方案。这种启发式方法是由领域专家设计的，且一般由于问题的困难性，这种方法不是最佳的。强化学习（RL）提出了一种很好的选择，使用监督或自我监督的方式训练 agent 来自动搜索这些启发式方法。在这篇调研中，我们探索了将 RL 框架

开发者 > 其他

作者：可爱又积极

10373

10
【ICML2021】密度约束强化学习
【ICML2021】密度约束强化学习

Fanhttps://www.zhuanzhi.ai/paper/4fa1ffa9d790da75a55a7f6e0aef8821我们从一个新的角度研究约束强化学习(CRL)，通过直接设置状态密度函数的约束，而不是以往研究中考虑的值函数。状态密度具有清晰的物理和数学解释，并能够表达各种各样的约束，如

开发者 > 其他

作者：可爱又积极

422

1
强化学习基础-蒙特卡洛(Monte Carlo)

141592653589793 ``` ## 强化学习中的应用 ### 基础应用在深度学习和强化学习领域中，许多算法实际上使用了Monte-Carlo方法，并没有给它冠名。这些算法如此基础，我们经常会忽略它的存在。例如由于计算资源受限，深度学习把一个批次样本的梯度作为整体梯度的估计

开发者 > 其他

作者： chenweifeng

248

1
强化学习从基础到进阶--案例与实践[7]：深度确定性策略梯度DDPG算法、双延迟深度确定性策略梯度TD3算法详解

DDPG DDPG 是深度Q网络的一个扩展版本，可以扩展到连续动作空间。在 DDPG 的训练中，它借鉴了深度Q网络的技巧：目标网络和经验回放。经验回放与深度Q网络是一样的，但目标网络的更新与深度Q网络的有点儿不一样。提出 DDPG 是为了让深度Q网络可以扩展到连续

开发者 > 博客

作者：汀丶

发表时间： 2023-06-27 23:36:16

66

0
深度用云先锋对话直播间
深度用云先锋对话直播间

深度用云先锋对话直播间深度用云先锋对话直播间马上登录，观看直播已有华为云账号，即刻登录还未注册华为云，即刻注册马上登录，观看回放已有华为云账号，即刻登录还未注册华为云，即刻注册直播正在恢复，请稍后重试华为云Stack 部署在政企客户本地数据中心的云基础设施，助力

其他
浅谈强化学习基本模型和原理
浅谈强化学习基本模型和原理

强化学习是从动物学习、参数扰动自适应控制等理论发展而来，其基本原理是：如果Agent的某个行为策略导致环境正的奖赏(强化信号)，那么Agent以后产生这个行为策略的趋势便会加强。Agent的目标是在每个离散状态发现最优策略以使期望的折扣奖赏和最大。强化学习强化学习把学习看作试探评

开发者 > 其他

作者： QGS

36

2

总条数： 10000

上一页
1
...
8
9
10
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

强化学习（十）Double DQN (DDQN)

深度学习matlab图像分类，手把手教程

D-Plan AI 生态伙伴计划

迎接“深度用云”时代

MATLAB与深度学习构建神经网络的实用指南

华为云hilens

深度解析 OpenCV 边界填充：方法、应用与实战代码详解

代码审计服务

强化学习(十一) Prioritized Replay DQN

分享IMPALA：大规模强化学习算法

强化学习AI的未来发展

深度诊断ECS - 弹性云服务器 ECS

基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型 - CodeArts IDE Online

AI市场强化学习预置算法实践----使用强化学习训练智能体玩转Atari小游戏（1）

强化学习组合优化综述论文

【ICML2021】密度约束强化学习

强化学习基础-蒙特卡洛(Monte Carlo)

强化学习从基础到进阶--案例与实践[7]：深度确定性策略梯度DDPG算法、双延迟深度确定性策略梯度TD3算法详解

深度用云先锋对话直播间

浅谈强化学习基本模型和原理

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线