内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • Panfrost GPU性能调优

    图1表示Mali GPU为代表的移动GPU硬件框图,一般4部分组成,其中GPUGPU-FW可以理解为一个硬件模块,但是为了理解Panfrost,特意将分为两个部分。当然移动GPU也可以是上图2组成,即添加PCIe总线和GPU独占GDDR模块。一般认为图2组成性能比图1性能要高,但是功耗也高,代码实现相对复杂。

    作者: tankaro
    发表时间: 2024-05-27 09:50:55
    22
    0
  • 【mindspore】【GPU性能GPU上的Element-wise算子的性能很差

    目前在GPU上训练一个调用了大量add、mul等element-wise算子的网络,速度比pytorch慢许多,profile一下发现是mindspore的element-wise算子出奇地慢,而pytorch的element-wise算子性能就比较正常,想请教一下可以如何优化?(没太看懂pytorch的实现细节)

    作者: Lear
    728
    5
  • 排行榜

    排行榜 在网页和APP中常常需要用到榜单的功能,对某个key-value的列表进行降序显示。当操作和查询并发大的时候,使用传统数据库就会遇到性能瓶颈,造成较大的时延。 使用分布式缓存服务(DCS)的Redis版本,可以实现一个商品热销排行榜的功能。它的优势在于:

  • 掌握XGBoost:GPU 加速与性能优化

    加速外,还可以通过调整其他参数来优化 XGBoost 的性能。以下是一些常用的性能优化参数: n_estimators:增加弱学习器的数量可能会提高性能,但会增加训练时间。 max_depth:限制树的最大深度可以降低过拟合风险并提高性能。 learning_rate:减小学习率可能会提高模型的泛化能力,但会增加训练时间。

    作者: Echo_Wish
    发表时间: 2024-02-15 21:33:34
    22
    0
  • 一文掌握Windows平台GPU深度学习开发环境部署

    网络模型,而不是简单调整性能,同时还可以在GPU上实现高性能现代并行计算。 CUDA与CUDNN的关系 CUDA看作是一个并行计算架构平台,cuDNN是基于CUDA的深度学习GPU加速库,有了它才能在GPU上完成深度学习的计算。想要在CUDA上运行深度神经网络,就要安装cuD

    作者: 机器未来
    发表时间: 2022-05-25 15:08:46
    1029
    0
  • 华为云GPU ECS搭建深度学习环境

    安装完成后,使用如下命令验证是否安装成功: pip show torch 如果查看到版本号,则表示安装成功。 至此,在华为云GPU ECS上搭建Pytorch 1.6的深度学习环境已完成。

    作者: 山海之光
    发表时间: 2022-05-05 04:21:06
    1225
    0
  • Facebook更新PyTorch 1.1,深度学习CPU抢GPU饭碗?

    爱所有Python化的东西。对于深度学习从业人员来说,PyTorch是TensorFlow之外的一个绝佳选择。通过学习了解不同深度学习框架,可以丰富其知识技能,针对实际业务需求选择最合适的框架。学习他小编推荐《PyTorch深度学习》。深度学习改变了很多产业,吴恩达(Andrew

    作者: 竹叶青
    发表时间: 2019-09-03 21:07:36
    12525
    0
  • 为什么构建深度学习模型需要使用GPU

    深度学习中,深度学习模型有两个主要的操作,也就是前向传递和后向传递。前向传递将输入数据通过神经网络后生成输出;后向传递根据前向传递得到的误差来更新神经网络的权重。在矩阵中,我们知道计算矩阵就是第一个数组的行与第二个数组的列元素分别相乘。因此,在神经网络中,我们可以将第一个矩阵视

    作者: yyy7124
    844
    1
  • 性能几何多重网格与 GPU 加速

    是解决非结构化网格问题的完美“黑箱”求解器,其中元素或 volumes 可以有不同数量的邻域,并且很难识别子问题。有一篇有趣的博客文章展示了GPU加速器使用 NVIDIA AmgX 库在 AMG 中显示出良好的性能。对于结构化问题,GMG 方法比 AMG 方法更有效,因为它们可以利用问题几何表示的附加信息。GMG 求解器

    作者: ShaderJoy
    发表时间: 2021-12-31 16:27:02
    788
    0
  • 指定GPU运行和训练python程序 、深度学习单卡、多卡 训练GPU设置【一文读懂】

    一、命令行运行python程序时 首先查看哪些GPU空闲,nvidia-smi显示当前GPU使用情况 nvidia-smi 如下图所示:服务器中的两个显卡,编号为0、1 . 都被同一个进程 PID 3016 占用 图示基础信息 GPUGPU 编号; Name:GPU 型号; Persis

    作者: 墨理学AI
    发表时间: 2022-01-09 06:31:22
    1451
    0
  • 指定GPU运行和训练 python程序 、深度学习单卡、多卡 训练GPU设置【一文读懂】

    首先查看哪些GPU空闲,nvidia-smi显示当前GPU使用情况 nvidia-smi 1 如下图所示:服务器中的两个显卡,编号为0、1 . 都被同一个进程 PID 3016 占用 图示基础信息 GPUGPU 编号; Name:GPU 型号; Per

    作者: 墨理学AI
    发表时间: 2022-01-10 16:23:43
    872
    0
  • 深度学习性能度量P

    损失是没有意义的。反之,我们必须使用不同的性能度量,使模型对每个样本都输出一个连续数值的得分。最常用的方法是输出模型在一些样本上概率对数的平均值。通常,我们会更加关注机器学习算法在未观测数据上的性能如何,因为这将决定其在现实生活中的性能如何。因此,我们使用测试数据来评估系统性能,同训练机器学习系统的数据分开

    作者: 小强鼓掌
    920
    2
  • 深度学习性能度量P

    损失是没有意义的。反之,我们必须使用不同的性能度量,使模型对每个样本都输出一个连续数值的得分。最常用的方法是输出模型在一些样本上概率对数的平均值。       通常,我们会更加关注机器学习算法在未观测数据上的性能如何,因为这将决定其在现实生活中的性能如何。因此,我们使用测试数据来评估系统性能,同训练机器学习系统的数

    作者: 小强鼓掌
    827
    4
  • 学习笔记-如何提升深度学习性能

    赛经验。性能提升的力度按下方技术方案的顺序从上到下依次递减:1. 从数据上提升性能   a. 收集更多的数据 b. 产生更多的数据 c. 对数据做缩放 d. 对数据做变换 e. 特征选择 f. 重新定义问题2. 从算法上提升性能   a. 算法的筛选 b. 从文献中学习 c. 重采样的方法3

    作者: RabbitCloud
    632
    1
  • 比较GPU和CPU训练深度学习算法的效率(附ubuntu GPU服务器配置攻略)

    ######一、GPU、CPU加速效果比较 近日,得到实验室GPU加速的深度学习服务器账号一枚。因为之前的模型训练过程实在太慢饱受模型调参,和模型调整的训练之苦。通常一个深度不算太深的模型都要在我的16核CPU主机上训练数天。网上查询说GPU深度学习中加速效果相当明显,有说3-

    作者: Tom forever
    发表时间: 2019-10-11 13:00:07
    8278
    0
  • [工程] gunicorn下的深度学习api 如何合理分配gpu

    9527 gpu_index = (worker_id + rand_max) % torch.cuda.device_count() print('current worker id {} set the gpu id :{}'.format(worker_id, gpu_index))

    作者: ~大鱼~
    发表时间: 2021-05-26 18:50:48
    1712
    0
  • ShaderJoy —— GPU 上的纹理性能优化实例( 基于 Android GPU Inspector,即 AGI)

    本例分别用到的工具( Android GPU Inspector,即 AGI; Nsight ) 优化实例 片段着色器最重要的任务就是从纹理当中获取和过滤像素值。 与其相关的 GPU 性能指标可以被总结为三类: 带宽 缓存行为(cache

    作者: ShaderJoy
    发表时间: 2021-11-18 17:08:24
    946
    0
  • GPU配置太麻烦?来试试Docker一键配置GPU深度学习开发环境吧

    自动驾驶物体检测系列 … @[toc] 1. 概述 在《物体检测快速入门系列(2)-Windows部署GPU深度学习开发环境》一文中已经描述了如何在Windows环境下部署GPU深度学习开发环境,但是要我推荐的话,我还是倾向于docker环境,无需安装cuda、cuDNN,docke

    作者: 机器未来
    发表时间: 2022-05-25 15:15:00
    1202
    0
  • 性能监控之Telegraf+InfluxDB+Grafana NVIDIA GPU实时监控

    时也在深度学习领域广泛应用。 预备知识 NVIDIA系统管理界面(nvidia-smi)是一个命令行实用程序,基于NVIDIA管理库(NVML),旨在帮助管理和监控NVIDIA GPU设备。 此实用程序允许管理员查询GPU设备状态并具有相应的权限,允许管理员修改GPU设备状态。它针对的是Tesla

    作者: zuozewei
    发表时间: 2021-08-23 14:58:05
    2680
    0
  • GPU 性能分析 + Shader 性能优化的一些指标及其含义

    效果。 GMEM 是 GPU 的本地内存,用于快速 Z、颜色和模板渲染。GPU 能够高效地将 GMEM 的所有混合像素作为单层写入到系统内存的帧缓冲中。GPU 通常受限在执行与图形渲染相关的任务。在 Snapdragon 中,Adreno 是为增强 GPGPU 性能而设计的,以共享 CPU

    作者: ShaderJoy
    发表时间: 2021-11-18 17:49:25
    1146
    0