已找到以下 10000 条记录
  • 【高并发】深度解析ScheduledThreadPoolExecutor类的源代码

    在【高并发专题】的专栏中,我们深度分析了ThreadPoolExecutor类的源代码,而ScheduledThreadPoolExecutor类是ThreadPoolExecutor类的子类。今天我们就来一起手撕ScheduledThreadPoolExecutor类的源代码。 构造方法

    作者: 冰 河
    发表时间: 2021-09-25 13:19:31
    2346
    0
  • 强化学习心得4

    Q-learning算法,算法步骤如下所示:引用《introduction to reinforcement learning》一书中的伪代码如下所示:两者的区别在于而Sarsa在每一步中以e-greedy的策略选取下一个状态动作值函数,而Q-learning在每一步TD中贪心的

    作者: xia1111
    850
    3
  • [ 转载 ] 六节课入门「深度强化学习」,UC伯克利教授Pieter Abbeel开课了

    将传统强化学习深度神经网络结合的深度强化学习,一直以来被视为更接近人类思维方式的人工智能方法。深度学习具备强感知能力但缺乏一定的决策能力,强化学习具备决策能力但对感知问题束手无策,因此将两者结合起来可以达到优势互补的效果,为复杂系统的感知决策问题提供了解决思路。 想要入门深度强化

    作者: MKT 黄不正
    4111
    5
  • 通过记忆的元强化学习

    尽管现代深度强化学习(RL)算法处于人工智能能力的前沿,但通常需要大量的训练样本才能达到与人类相当的性能水平。这种严重的数据效率低下是深度RL实际应用的主要障碍: 在没有模拟器的情况下,几乎不可能将深度RL应用到任何领域。为了解决这一关键的数据低效问题,在本文中,我们致力于设计能

    作者: 可爱又积极
    844
    2
  • 使用强化学习内置环境

    05/10/214611s75kapmgyvyjhb7n.png) #### 进入AI Gallery订阅强化学习算法 ModelArts预置的强化学习算法(名为“强化学习预置算法”)发布在AI Gallery中。您可以前往AI Gallery,订阅此模型,然后同步至ModelArts中。

    作者: 运气男孩
    925
    1
  • 深度学习:Xavier初始化理论+代码实现

    @TOC Xavier初始化理论 权值初始化对网络优化至关重要。早年深度神经网络无法有效训练的一个重要原因就是早期人们对初始化不太重视。我们早期用的方法大部分都是随机初始化,而随着网络深度的加深,随机初始化在控制数值稳定性上也可能失效。Xavier这个方法可以考虑输入层与输出层的维度,使在forward

    作者: hanzee_
    发表时间: 2022-10-14 05:50:16
    791
    0
  • 使用强化学习内置环境

    05/10/214611s75kapmgyvyjhb7n.png) #### 进入AI Gallery订阅强化学习算法 ModelArts预置的强化学习算法(名为“强化学习预置算法”)发布在AI Gallery中。您可以前往AI Gallery,订阅此模型,然后同步至ModelArts中。

    作者: 运气男孩
    1566
    3
  • 强化学习算法中SARSA

    这使得SARSA算法更适合于处理连续决策问题,如强化学习中的马尔可夫决策过程(Markov Decision Process)。 总之,SARSA是一种基于状态-动作-奖励-下一个状态-下一个动作的模式进行学习和决策的强化学习算法。它通过差分更新的方式逐步调整状态-动作对的价值

    作者: 皮牙子抓饭
    发表时间: 2023-08-29 09:12:54
    5
    0
  • 【OFDM通信】基于matlab深度学习OFDM系统信号检测【含Matlab源码 2023期】

    permute(ReceivedPacket,[2,3,1]); 三、运行结果 四、matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1] 高俊伟.基于深度学习的OFDM信号检测算法研究[D].哈尔滨工程大学 3 备注 简介此部分摘自互联网,仅供参考,若侵权,联系删除

    作者: 海神之光
    发表时间: 2022-08-08 15:35:50
    279
    0
  • 基于深度学习的海洋鱼类识别算法matlab仿真

    sp;   综上所述,基于深度学习的海洋鱼类识别算法主要通过构建和训练深度卷积神经网络,从大量标注的海洋鱼类图像中学习特征,进而对未知图像进行准确的鱼类种类识别。这个过程涉及到复杂的数学运算和优化策略,体现了深度学习在图像识别领域的强大能力。    

    作者: 简简单单做算法
    发表时间: 2024-04-08 20:50:28
    67
    0
  • 基于深度学习的鸟类识别系统matlab仿真

    算法运行软件版本 matlab2022a   3.算法理论概述         鸟类识别是计算机视觉领域中的一个重要应用,它要求系统能够准确地从图像或视频中识别出鸟的种类。随着深度学习技术的发展,特别

    作者: 简简单单做算法
    发表时间: 2024-02-27 19:09:23
    2
    0
  • 什么是 强化学习 (Reinforcement Learning)

    强化学习是机器学习大家族中的一大类, 使用强化学习能够让机器学着如何在环境中拿到高分, 表现出优秀的成绩. 而这些成绩背后却是他所付出的辛苦劳动, 不断的试错, 不断地尝试, 累积经验, 学习经验.强化学习是一类算法, 是让计算机实现从一开始什么都不懂, 脑袋里没有一点想法, 通过不断地尝试

    作者: 角动量
    1873
    1
  • 深度学习】嘿马深度学习笔记第4篇:TensorFlow介绍,学习目标【附代码文档】

    1 案例:xml读取本地文件存储到pkl 5.2.1.1 解析结构 完整笔记资料代码->:https://gitee.com/yinuo112/AI/tree/master/深度学习/嘿马深度学习笔记/note.md 感兴趣的小伙伴可以自取哦~ 全套教程部分目录: 部分文件图片:

    作者: 程序员一诺python
    发表时间: 2024-08-24 21:47:08
    23
    0
  • 深度学习】嘿马深度学习笔记第3篇:TensorFlow介绍,学习目标【附代码文档】

    本教程的知识点为:深度学习介绍 1.1 深度学习与机器学习的区别 TensorFlow介绍 2.4 张量 2.4.1 张量(Tensor) 2.4.1.1 张量的类型 TensorFlow介绍 1.2 神经网络基础 1.2.1 Logistic回归

    作者: 程序员一诺python
    发表时间: 2024-08-19 14:01:57
    80
    0
  • 强化学习心得2

    一只熊;而强化学习输出的是当看到一只熊时要作出怎样的反应,是趴下装死还是赶紧跑路。对于一颗植物来说,对于植物现在时刻的状态选择浇水或者不浇水,都会以一定的概率得到植物的下一个状态。这就是强化学习。对于强化学习来说,有以下4个核心组成部分:强化学习四元组E = <S,A,P,R>s:state

    作者: xia1111
    1052
    1
  • 【RL】元强化学习(MRL)VS 基于迁移学习的强化学习(RL-TL)

    基于迁移学习的强化学习(RL-TL)》 元强化学习(MRL)VS 基于迁移学习的强化学习(RL-TL) 目录 1.元强化学习(Meta Reinforcement Learning)与基于迁移学习的强化学习之间的区别 2.具体解释 3.两者的应用场景 4.总结 5.元学习(Meta

    作者: 不去幼儿园
    发表时间: 2024-12-03 08:23:44
    49
    0
  • 强化学习网络模型

    每一个自主体是由两个神经网络模块组成,即行动网络和评估网络。行动网络是根据当前的状态而决定下一个时刻施加到环境上去的最好动作。对于行动网络,强化学习算法允许它的输出结点进行随机搜索,有了来自评估网络的内部强化信号后,行动网络的输出结点即可有效地完成随机搜索并且大大地提高选择好的动作的

    作者: QGS
    419
    1
  • 深度学习】嘿马深度学习笔记第2篇:TensorFlow介绍,学习目标【附代码文档】

    2.1 案例:xml读取本地文件存储到pkl 5.2.1.1 解析结构 全套笔记资料代码移步: https://gitee.com/yinuo112/AI/tree/master/深度学习/嘿马深度学习笔记/note.md 感兴趣的小伙伴可以自取哦~ 全套教程部分目录: 部分文件图片:

    作者: 程序员一诺python
    发表时间: 2024-08-17 18:38:27
    3
    0
  • 强化学习(一)模型基础

     从今天开始整理强化学习领域的知识,主要参考的资料是Sutton的强化学习书和UCL强化学习的课程。这个系列大概准备写10到20篇,希望写完后自己的强化学习碎片化知识可以得到融会贯通,也希望可以帮到更多的人,毕竟目前系统的讲解强化学习的中文资料不太多。     第一篇会从强化学习的基本概

    作者: 格图洛书
    发表时间: 2021-12-29 15:34:17
    473
    0
  • easyRL学习笔记:强化学习基础

    习是异策略的每次算maxQ,第六章深度Q网络是只属于异策略部分的一个深度算法。 第六章刚开始的价值函数近似只有Q函数近似,是不是就是说策略迭代时候从Q表格找maxQ用近似函数代替,价值迭代时候不需要近似V函数,然后这个近似Q和不近似的V再用深度网络训练。 DQN里还有目标网络,是

    作者: irrational
    发表时间: 2022-08-30 16:46:05
    288
    0