搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

排行榜
排行榜

排行榜在网页和APP中常常需要用到榜单的功能，对某个key-value的列表进行降序显示。当操作和查询并发大的时候，使用传统数据库就会遇到性能瓶颈，造成较大的时延。使用分布式缓存服务（DCS）的Redis版本，可以实现一个商品热销排行榜的功能。它的优势在于：

开发者 > 开发服务
【mindspore】【GPU性能】GPU上的Element-wise算子的性能很差

目前在GPU上训练一个调用了大量add、mul等element-wise算子的网络，速度比pytorch慢许多，profile一下发现是mindspore的element-wise算子出奇地慢，而pytorch的element-wise算子性能就比较正常，想请教一下可以如何优化？（没太看懂pytorch的实现细节）

开发者 > 其他

作者： Lear

728

5
Panfrost GPU性能调优
Panfrost GPU性能调优

图1表示Mali GPU为代表的移动GPU硬件框图，一般4部分组成，其中GPU和GPU-FW可以理解为一个硬件模块，但是为了理解Panfrost，特意将分为两个部分。当然移动GPU也可以是上图2组成，即添加PCIe总线和GPU独占GDDR模块。一般认为图2组成性能比图1性能要高，但是功耗也高，代码实现相对复杂。

开发者 > 博客

作者： tankaro

发表时间： 2024-05-27 09:50:55

22

0
高性能几何多重网格与 GPU 加速

是解决非结构化网格问题的完美“黑箱”求解器，其中元素或 volumes 可以有不同数量的邻域，并且很难识别子问题。有一篇有趣的博客文章展示了GPU加速器使用 NVIDIA AmgX 库在 AMG 中显示出良好的性能。对于结构化问题，GMG 方法比 AMG 方法更有效，因为它们可以利用问题几何表示的附加信息。GMG 求解器

开发者 > 博客

作者： ShaderJoy

发表时间： 2021-12-31 16:27:02

788

0
掌握XGBoost：GPU 加速与性能优化

GBoost进行GPU加速以及性能优化的方法。首先，我们安装了支持GPU的XGBoost版本，并启用了GPU加速。然后，我们调整了模型参数以优化性能，并进行了性能评估。通过这篇博客教程，您可以详细了解如何在Python中使用XGBoost进行GPU加速以及性能优化的方法。您可以

开发者 > 博客

作者： Echo_Wish

发表时间： 2024-02-15 21:33:34

22

0
Facebook更新PyTorch 1.1,深度学习CPU抢GPU饭碗？

GPU机器）。如果刚开始深度学习，或在财务受限的情况下为公司的应用配置机器时，使用云服务就很经济。优化后的系统性能可能有较大提升。图1.6所示为不同CPU和GPU的性能基准的对比。数据和算法数据是完成深度学习最重要的组成部分，由于互联网的普及和智能手机应用的增长，一些大公司，如F

开发者 > 博客

作者：竹叶青

发表时间： 2019-09-03 21:07:36

12525

0
比较GPU和CPU训练深度学习算法的效率（附ubuntu GPU服务器配置攻略）

######一、GPU、CPU加速效果比较近日，得到实验室GPU加速的深度学习服务器账号一枚。因为之前的模型训练过程实在太慢饱受模型调参，和模型调整的训练之苦。通常一个深度不算太深的模型都要在我的16核CPU主机上训练数天。网上查询说GPU在深度学习中加速效果相当明显，有说3-

开发者 > 博客

作者： Tom forever

发表时间： 2019-10-11 13:00:07

8278

0
2021 编程语言排行榜出炉！
2021 编程语言排行榜出炉！

IEEE 2021 编程语言排行榜的具体情况如下。 Top 10 编程语言：Python 五连冠、微软 C# 语言排名飞升与 2020 年排行榜相比，Python、Java、C、C++ 和 JavaScript 依然占据 2021 排行榜的前 5 名。但是，6 至 10

开发者 > 博客

作者： C语言与CPP编程

发表时间： 2022-01-06 15:53:58

576

0
ShaderJoy —— GPU 上的纹理性能优化实例（基于 Android GPU Inspector，即 AGI）

本例分别用到的工具（ Android GPU Inspector，即 AGI； Nsight ）优化实例片段着色器最重要的任务就是从纹理当中获取和过滤像素值。与其相关的 GPU 性能指标可以被总结为三类：带宽缓存行为（cache

开发者 > 博客

作者： ShaderJoy

发表时间： 2021-11-18 17:08:24

946

0
性能监控之Telegraf+InfluxDB+Grafana NVIDIA GPU实时监控

Temp：温度，单位是摄氏度； Perf：性能状态，从P0到P12，P0表示最大性能，P12表示状态最小性能（即 GPU 未工作时为P0，达到最大工作限度时为P12）。 Pwr:Usage/Cap：能耗； Memory Usage：显存使用率； Bus-Id：涉及GPU总线的东西，domain:bus:device

开发者 > 博客

作者： zuozewei

发表时间： 2021-08-23 14:58:05

2680

0
为什么构建深度学习模型需要使用GPU

在深度学习中，深度学习模型有两个主要的操作，也就是前向传递和后向传递。前向传递将输入数据通过神经网络后生成输出；后向传递根据前向传递得到的误差来更新神经网络的权重。在矩阵中，我们知道计算矩阵就是第一个数组的行与第二个数组的列元素分别相乘。因此，在神经网络中，我们可以将第一个矩阵视

开发者 > 其他

作者： yyy7124

844

1
【MindSpore】DCPUE网络性能优化 -- GPU训练篇

CPU 资源更多。据此可以断定，使用 MindSpore 框架训练该网络的性能瓶颈在 CPU 相关的操作部分。 6. 由于在 GPU 上训练，CPU 相关的操作只涉及样本数据的处理、数据处理完后拷贝到 GPU 这些。咨询 MindSpore 框架负责数据处理部分的专家，了解到原因为：

开发者 > 其他

作者： zhuyuxiao

3441

0
GPU 性能分析 + Shader 性能优化的一些指标及其含义

效果。 GMEM 是 GPU 的本地内存，用于快速 Z、颜色和模板渲染。GPU 能够高效地将 GMEM 的所有混合像素作为单层写入到系统内存的帧缓冲中。GPU 通常受限在执行与图形渲染相关的任务。在 Snapdragon 中，Adreno 是为增强 GPGPU 性能而设计的，以共享 CPU

开发者 > 博客

作者： ShaderJoy

发表时间： 2021-11-18 17:49:25

1146

0
GPU — 分布式训练
GPU — 分布式训练

CPU 和 GPU 性能提升不平衡先纵向扩展，再横向扩展 GPU 型号，NVLink，NVSwitch，DGX，10G/25G/100G/200G 的匹配和选择混合精度 GPU Direct RDMA（Infiniband）从 CPU 中卸载一些操作到 GPU（e.g

开发者 > 博客

作者：云物互联

发表时间： 2022-07-14 16:00:23

240

0
【转载】AI框架在GPU上训练性能优化实践（1）

管理的性能。上述每一项又会涉及到较多的技术细节问题。本文重点从GPU算子优化，分布式多机多卡加速比的提升，以及数据与计算Pipeline并行三个视角出发，介绍神经网络在GPU上训练的通用性能优化方法。GPU算子性能优化在网络训练中，占比最大的是算子的计算时间，因此算子的性能好坏对

开发者 > 其他

作者： chengxiaoli

4542

2
GPU与Cuda
GPU与Cuda

块的乘法，处理速度非常快。这也是GPU比CPU快且更适合于深度学习的第三个原因。三.什么是cuda？显卡：（GPU）主流是NVIDIA的GPU，深度学习本身需要大量计算。GPU的并行计算能力，在过去几年里恰当地满足了深度学习的需求。AMD的GPU基本没有什么支持，可以不用考虑。驱

开发者 > 博客

作者： qinggedada

发表时间： 2020-08-11 17:46:46

7676

0
深度学习——PyCharm配置远程服务器（蓝耘GPU智算云）指南

深度学习——PyCharm配置远程服务器（蓝耘GPU智算云）指南介绍深度学习是一种机器学习技术，广泛应用于图像识别、自然语言处理等领域。为了高效训练大型模型，研究人员通常选择性能强大的远程GPU服务器，如蓝耘GPU智算云。本指南将详细介绍如何在PyCharm中配置远程服务器，以便于本地开发和远程训练。

开发者 > 博客

作者：鱼弦

发表时间： 2024-09-10 09:39:38

272

0
linux查看GPU配置
linux查看GPU配置

下面一张表示每个进程占用的显存使用率。显存占用和GPU占用是两个不一样的东西，显卡是由GPU和显存等组成的，显存和GPU的关系有点类似于内存和CPU的关系。我跑caffe代码的时候显存占得少，GPU占得多，师弟跑TensorFlow代码的时候，显存占得多，GPU占得少。查看GPU型号 lspci |

开发者 > 博客

作者： irrational

发表时间： 2022-02-06 16:17:42

1577

0
学习笔记-如何提升深度学习性能？

数据城堡作者DC君的竞赛经验。性能提升的力度按下方技术方案的顺序从上到下依次递减：1. 从数据上提升性能 a. 收集更多的数据 b. 产生更多的数据 c. 对数据做缩放 d. 对数据做变换 e. 特征选择 f. 重新定义问题2. 从算法上提升性能 a. 算法的筛选 b. 从文献中学习

开发者 > 其他

作者： RabbitCloud

632

1
指定GPU运行和训练python程序、深度学习单卡、多卡训练GPU设置【一文读懂】

一、命令行运行python程序时首先查看哪些GPU空闲，nvidia-smi显示当前GPU使用情况 nvidia-smi 如下图所示：服务器中的两个显卡，编号为0、1 . 都被同一个进程 PID 3016 占用图示基础信息 GPU：GPU 编号； Name：GPU 型号； Persis

开发者 > 博客

作者：墨理学AI

发表时间： 2022-01-09 06:31:22

1451

0

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

排行榜

【mindspore】【GPU性能】GPU上的Element-wise算子的性能很差

Panfrost GPU性能调优

高性能几何多重网格与 GPU 加速

掌握XGBoost：GPU 加速与性能优化

Facebook更新PyTorch 1.1,深度学习CPU抢GPU饭碗？

比较GPU和CPU训练深度学习算法的效率（附ubuntu GPU服务器配置攻略）

2021 编程语言排行榜出炉！

ShaderJoy —— GPU 上的纹理性能优化实例（基于 Android GPU Inspector，即 AGI）

性能监控之Telegraf+InfluxDB+Grafana NVIDIA GPU实时监控

为什么构建深度学习模型需要使用GPU

【MindSpore】DCPUE网络性能优化 -- GPU训练篇

GPU 性能分析 + Shader 性能优化的一些指标及其含义

GPU — 分布式训练

【转载】AI框架在GPU上训练性能优化实践（1）

GPU与Cuda

深度学习——PyCharm配置远程服务器（蓝耘GPU智算云）指南

linux查看GPU配置

学习笔记-如何提升深度学习性能？

指定GPU运行和训练python程序、深度学习单卡、多卡训练GPU设置【一文读懂】

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线