已找到以下 10000 条记录
  • AI市场强化学习预置算法实践----使用强化学习训练智能体玩转Atari小游戏(2)

    在上一篇实践教程中,我们结合ModelArts平台的最佳实践文档,使用AI市场的强化学习预置算法,完成了玩Atari小游戏Breakout的智能体的训练。训练好的模型及配置文件在自己的OBS文件夹内,具体要怎么“欣赏”我们训练的智能体玩游戏呢?实际上,这是一个推理并可视化的过程。

    作者: 灰灰爱喝粥
    发表时间: 2020-09-12 18:33:02
    8575
    0
  • 强化学习算法中Q-learning

    强化学习是一种机器学习方法,用于训练智能体在与环境交互的过程中学习最佳行动策略。Q-learning是强化学习中的一种基于值函数的算法,用于解决马尔科夫决策问题。 Q-learning的核心思想是通过学习一个状态-动作值函数(Q函数),来指导智能体在环境中选择最佳的行动。Q函数

    作者: 皮牙子抓饭
    发表时间: 2023-08-29 09:12:09
    5
    0
  • 深度学习:主流框架和编程实战》——2.3.4 详细代码解析(1)

    2.3.4 详细代码解析(1)1)cifar10_main.py文件是该图像分类程序的入口,通过调用自定义的训练函数和测试函数开始训练网络,并在训练完毕后对网络进行测试。cifar10_main.py# 导入cifar10_train中所有函数from cifar10_train

    作者: 华章计算机
    发表时间: 2019-06-05 16:44:26
    3626
    0
  • 深度学习计算服务平台

    深度学习计算服务平台是中科弘云面向有定制化AI需求的行业用户,推出的AI开发平台,提供从样本标注、模型训练、模型部署的一站式AI开发能力,帮助用户快速训练和部署模型,管理全周期AI工作流。平台为开发者设计了众多可帮助降低开发成本的开发工具与框架,例如AI数据集、AI模型与算力等。

  • 不需要训练数据的强化学习RL

    图像作为训练数据。 强化学习与之不同,不需要训练数据,而是设置一个环境。 类似于动物处在自然环境中,强化学习需要不断与环境交互,并从中学习。强化学习研究常用的环境是各种各样的游戏。 强化学习方法简单、有效且通用,在许多游戏环境中都取得了超越人类的决策水平,被 DeepMind 认为是实现通用人工智能的一种重要途径。

    作者: 黄生
    1624
    4
  • 华为云代码检查服务CodeArts Check深度解读

    Check代码检查服务,支持海量源代码的风格、质量和安全检查,可实现百亿行大规模并行扫描,并提供完善的修改指导和趋势分析,帮助企业有效管控代码质量。   特性一、自研代码检查引擎,全面评估代码质量七特征 代码检查服务的核心是代码检查引擎。高效精准的代码检查引擎可帮

    作者: 华为云头条
    发表时间: 2023-01-13 10:39:13
    214
    0
  • 强化学习第一课复习

    智能体不能得到即时的反馈,所以很困难。 1-3 强化学习的基本特征有哪些? (1)强化学习会试错探索,它通过探索环境来获取对环境的理解。 (2)强化学习智能体会从环境里面获得延迟的奖励。 (3)在强化学习的训练过程中,时间非常重要。因为我们得到的是有时间关联的数据(sequential

    作者: livingbody
    发表时间: 2022-11-15 08:36:03
    186
    0
  • 深度用云先锋对话直播间0119

    安全地绘出“无边界”应用蓝图。 了解更多 深度用云全球行,华为云Stack与5200+客户携手并进 践行深度用云,加速智能升级,华为云Stack与您携手同行。共赴云深处,共创新高度! 了解更多 华为云Stack助力政企数字化转型迈入深度用云新阶段 部署在政企客户本地数据中心的云基

  • 深度用云先锋对话直播间

    据治理效率10-20倍以上。 了解更多 华为云Stack助力政企数字化转型迈入深度用云新阶段 部署在政企客户本地数据中心的云基础设施,助力客户从业务上云迈向深度用云,释放数字生产力。 了解更多 政企深度用云沙龙,共话行业前沿与未来 华为云Stack面向政企数字化转型先行者搭建的罗

  • 使用模型 - CodeArts IDE Online

    鲲鹏镜像暂时无法安装TensorFlow,敬请期待后续更新。 父主题: 基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

  • OpenAI Gym 中级教程——强化学习实践项目

    Python OpenAI Gym 中级教程:强化学习实践项目 在本篇博客中,我们将通过一个实际项目来演示如何在 OpenAI Gym 中应用强化学习算法。我们选择一个简单而经典的问题:CartPole,这是一个控制小车平衡杆的问题。我们将使用深度 Q 网络(DQN)算法来解决这个问题。

    作者: Echo_Wish
    发表时间: 2024-02-01 09:12:19
    67
    0
  • 强化学习入门-第一课【笔记】

    1.3 强化学习的历史 强化学习是有一定的历史的,早期的强化学习,我们称其为标准强化学习。最近业界把强化学习深度学习结合起来,就形成了深度强化学习(deep reinforcemet learning),因此,深度强化学习 = 深度学习 + 强化学习。我们可将标准强化学习和深度强

    作者: livingbody
    发表时间: 2022-11-14 11:02:35
    187
    0
  • 基于Googlenet深度学习网络的螺丝瑕疵检测matlab仿真

    t 。GoogleNet是Google研发的深度网络结构,之所以叫“GoogLeNet”,是为了向“LeNet”致敬.人员行为动作识别是计算机视觉和深度学习领域的重要应用之一。近年来,深度学习网络在人员行为动作识别中取得了显著的成果。

    作者: 简简单单做算法
    发表时间: 2023-11-06 23:57:19
    96
    0
  • 基于Googlenet深度学习网络的人脸身份识别matlab仿真

    t 。GoogleNet是Google研发的深度网络结构,之所以叫“GoogLeNet”,是为了向“LeNet”致敬.人员行为动作识别是计算机视觉和深度学习领域的重要应用之一。近年来,深度学习网络在人员行为动作识别中取得了显著的成果。

    作者: 简简单单做算法
    发表时间: 2023-11-10 22:59:07
    8
    0
  • 准备工作 - CodeArts IDE Online

    Editor,可以在里面编辑和运行cell。 父主题: 基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

  • 深度学习:手写反向传播算法(BackPropagation)与代码实现

    ∂w1​∂l1​​=∂z1​∂l1​​∂w1​∂z1​​=∂z3​∂l1​​∂z1​∂z3​​∂w1​∂z1​​ 有了偏导数,我们就可以重复上述操作,直至更新完所有参数。 代码实现 import torch.nn as nn import torch.nn.functional as F x = torch.tensor([2

    作者: hanzee_
    发表时间: 2022-10-14 05:51:05
    727
    0
  • 一文详解强化学习(Reinforcement Learning)

    Process, MDP),这是强化学习最核心的数学模型。 为什么强化学习重要? 实用性与广泛应用 强化学习的重要性首先体现在其广泛的应用价值。从自动驾驶、游戏AI、到量化交易、工业自动化,以及近年来在自然语言处理、推荐系统等方面的突破,强化学习都发挥着不可或缺的角色。 自适应与优化

    作者: TechLead
    发表时间: 2023-11-15 17:54:45
    20
    0
  • 深度学习:主流框架和编程实战》——2.3.4 详细代码解析(3)

    2.3.4 详细代码解析(3)5)resnet.py文件定义了ResNet的网络模型,包括输出层、批次正则化层、卷积层、残差模块函数等。resnet.py#以np的形式导入numpy,主要用于利用数组表示向量、矩阵数据结构import numpy as np#从hyper_par

    作者: 华章计算机
    发表时间: 2019-06-05 16:56:38
    3771
    0
  • 强化学习组合优化综述论文

    工构造的启发式算法,这些启发式算法能够依次地构造解决方案。这种启发式方法是由领域专家设计的,且一般由于问题的困难性,这种方法不是最佳的。强化学习(RL)提出了一种很好的选择,使用监督或自我监督的方式训练 agent 来自动搜索这些启发式方法。在这篇调研中,我们探索了将 RL 框架

    作者: 可爱又积极
    10371
    10
  • 【ICML2021】密度约束强化学习

    Fanhttps://www.zhuanzhi.ai/paper/4fa1ffa9d790da75a55a7f6e0aef8821我们从一个新的角度研究约束强化学习(CRL),通过直接设置状态密度函数的约束,而不是以往研究中考虑的值函数。状态密度具有清晰的物理和数学解释,并能够表达各种各样的约束,如

    作者: 可爱又积极
    422
    1