已找到以下 10000 条记录。
  • 华为云代码检查服务CodeArts Check深度解读

    Check代码检查服务,支持海量源代码的风格、质量和安全检查,可实现百亿行大规模并行扫描,并提供完善的修改指导和趋势分析,帮助企业有效管控代码质量。   特性一、自研代码检查引擎,全面评估代码质量七特征 代码检查服务的核心是代码检查引擎。高效精准的代码检查引擎可帮

    作者: 华为云头条
    发表时间: 2023-01-13 10:39:13
    214
    0
  • AI市场强化学习预置算法实践----使用强化学习训练智能体玩转Atari小游戏(2)

    在上一篇实践教程中,我们结合ModelArts平台的最佳实践文档,使用AI市场的强化学习预置算法,完成了玩Atari小游戏Breakout的智能体的训练。训练好的模型及配置文件在自己的OBS文件夹内,具体要怎么“欣赏”我们训练的智能体玩游戏呢?实际上,这是一个推理并可视化的过程。

    作者: 灰灰爱喝粥
    发表时间: 2020-09-12 10:33:02
    2867
    0
  • 基于K-means(K均值)聚类算法的图像特征分割研究-含Matlab代码-转载

    Geosciences, 2010,36(10):1261-1267.  ✳️ 五、Matlab代码获取 上述Matlab代码,可私信博主获取。 ———————————————— 版权声明:本文为CSDN博主「matlab科研中心」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原

    作者: 吃完就睡,快乐加倍
    58
    1
  • 【3月16日 AI 快讯】UC伯克利最新深度学习课程上线,强化学习大牛Sergey Levine授课(B站可看)

    入门重磅预告 | 自动化所强化学习与运筹优化前沿技术论坛即将起航!自动化所强化学习与运筹优化前沿技术论坛即将起航!2021/03/15 18:56原文链接产业看日本农民用智慧农业技术都做了什么日本作为现代化农业技术的代表国家,在智慧农业领域颇有投入。由于日本是岛国,土地资源不足、

    作者: AI资讯
    1643
    2
  • MindSpore A2C 强化学习

    今天我们使用A2C算法进行训练。 Advantage Actor-Critic (A2C)算法是一个强化学习算法,它结合了策略梯度(Actor)和价值函数(Critic)的方法。A2C算法在许多强化学习任务中表现优越,因为它能够利用价值函数来减少策略梯度的方差,同时直接优化策略。 A2C算法的核心思想

    作者: irrational
    发表时间: 2024-06-04 11:00:14
    18
    0
  • 分享IMPALA:大规模强化学习算法

    论文名称:Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures作者:Lasse Espeholt / Hubert Soyer / Remi Munos / Karen Simonyan

    作者: 初学者7000
    1359
    4
  • 【Datawhale动手学深度学习笔记】多层感知机代码实践

    function)通过计算加权和并加上偏置来确定神经元是否应该被激活, 它们将输入信号转换为输出的可微运算。 大多数激活函数都是非线性的。 由于激活函数是深度学习的基础,下面简要介绍一些常见的激活函数。 #引入包 %matplotlib inline import torch from d2l import

    作者: JeffDing
    发表时间: 2023-03-24 10:19:19
    133
    0
  • 强化学习组合优化综述论文

    工构造的启发式算法,这些启发式算法能够依次地构造解决方案。这种启发式方法是由领域专家设计的,且一般由于问题的困难性,这种方法不是最佳的。强化学习(RL)提出了一种很好的选择,使用监督或自我监督的方式训练 agent 来自动搜索这些启发式方法。在这篇调研中,我们探索了将 RL 框架

    作者: 可爱又积极
    10371
    10
  • 华为云代码检查服务CodeArts Check深度解读

    rts Check代码检查服务,支持海量源代码的风格、质量和安全检查,可实现百亿行大规模并行扫描,并提供完善的修改指导和趋势分析,帮助企业有效管控代码质量。 特性一、自研代码检查引擎,全面评估代码质量七特征 代码检查服务的核心是代码检查引擎。高效精准的代码检查引擎可帮助用户在

    作者: 华为云PaaS服务小智
    发表时间: 2023-02-15 10:03:33
    407
    0
  • 【ICML2021】密度约束强化学习

    Fanhttps://www.zhuanzhi.ai/paper/4fa1ffa9d790da75a55a7f6e0aef8821我们从一个新的角度研究约束强化学习(CRL),通过直接设置状态密度函数的约束,而不是以往研究中考虑的值函数。状态密度具有清晰的物理和数学解释,并能够表达各种各样的约束,如

    作者: 可爱又积极
    421
    1
  • OpenAI Gym 中级教程——强化学习实践项目

    Python OpenAI Gym 中级教程:强化学习实践项目 在本篇博客中,我们将通过一个实际项目来演示如何在 OpenAI Gym 中应用强化学习算法。我们选择一个简单而经典的问题:CartPole,这是一个控制小车平衡杆的问题。我们将使用深度 Q 网络(DQN)算法来解决这个问题。

    作者: Echo_Wish
    发表时间: 2024-02-01 09:12:19
    67
    0
  • 深度学习:手写反向传播算法(BackPropagation)与代码实现

    ∂w1​∂l1​​=∂z1​∂l1​​∂w1​∂z1​​=∂z3​∂l1​​∂z1​∂z3​​∂w1​∂z1​​ 有了偏导数,我们就可以重复上述操作,直至更新完所有参数。 代码实现 import torch.nn as nn import torch.nn.functional as F x = torch.tensor([2

    作者: hanzee_
    发表时间: 2022-10-14 05:51:05
    727
    0
  • 深度学习:主流框架和编程实战》——2.3.4 详细代码解析(3)

    2.3.4 详细代码解析(3)5)resnet.py文件定义了ResNet的网络模型,包括输出层、批次正则化层、卷积层、残差模块函数等。resnet.py#以np的形式导入numpy,主要用于利用数组表示向量、矩阵数据结构import numpy as np#从hyper_par

    作者: 华章计算机
    发表时间: 2019-06-05 08:56:38
    2621
    0
  • 深度学习

    的背景对理解深度学习是有用的,深度学习经历了三次发展浪潮:20世纪40年代到60年代深度学习的雏形出现在控制论(cybernetics)中,20世纪80年代到90年代深度学习表现为联结主义(connectionism),直到2006年,才真正以深度学习之名复兴,深度学习是支撑人工

    作者: QGS
    955
    4
  • 强化学习基础-蒙特卡洛(Monte Carlo)

    141592653589793 ``` ## 强化学习中的应用 ### 基础应用 在深度学习和强化学习领域中,许多算法实际上使用了Monte-Carlo方法,并没有给它冠名。这些算法如此基础,我们经常会忽略它的存在。 例如由于计算资源受限,深度学习把一个批次样本的梯度作为整体梯度的估计

    作者: chenweifeng
    244
    1
  • 【安全强化学习· 一】Safe Reinforcement Learning(一)

    安全强化学习(Safe Reinforcement Learning)定义:广义的定义:考虑安全或风险等概念的强化学习Definition (specific): Safe Reinforcement Learning can be defined as the process of

    作者: 荷籽
    发表时间: 2020-06-30 02:09:07
    9283
    2
  • 深度学习

    使用深度学习方法处理计算机视觉问题的过程类似于人类的学习过程:我们搭建的深度学习模型通过对现有图片的不断学**结出各类图片的特征,最后输出一个理想的模型,该模型能够准确预测新图片所属的类别。图1-2展示了两个不同的学习过程,上半部分是通过使用深度学习模型解决图片分类问题,下半部分

    作者: 生命无价
    1554
    1
  • PaaS技术创新Lab--DevAI--社会招聘

    1、AI、大数据处理等机器学习、深度学习、强化学习算法建模、分析、设计和研发; 2、基于智能化算法赋能devops开发运维全流程智能化转型; 3、基于代码分析、数据挖掘、机器学习等手段,面向软件开发人员孵化并交付高可用开发利器,包括但不限于代码缺陷自动检测与修复服务、代码自动合并服务、代码开源成分分析服务、代码搜索服务等;

  • 一文详解强化学习(Reinforcement Learning)

    Process, MDP),这是强化学习最核心的数学模型。 为什么强化学习重要? 实用性与广泛应用 强化学习的重要性首先体现在其广泛的应用价值。从自动驾驶、游戏AI、到量化交易、工业自动化,以及近年来在自然语言处理、推荐系统等方面的突破,强化学习都发挥着不可或缺的角色。 自适应与优化

    作者: TechLead
    发表时间: 2023-11-15 17:54:45
    20
    0
  • 深度学习应用实战案例-员工流失预测模型(Python源代码

    前言 有人离职是因为“世界那么大,我想去看看”,也有人觉得“怀有绝技在身,不怕天下无路”。 文中涉及完整源码请参见, Python源码集锦-员工离职预测模型 员工离职对于企业而言有什么影响呢? 数据分析精华案例-员工流失建模与预测实例

    作者: 格图洛书
    发表时间: 2021-11-18 17:04:55
    1010
    0