搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

传统深度学习算法能运行在NPU上吗？

比如如下算法：图像去噪、SIFT算法获取特征、获取角点、图像矫正

开发者 > 其他

作者：南山吃鸡王

1820

4
NPU上运行onnxruntime
NPU上运行onnxruntime

通过如上命令，可以看到环境上确实安装的是gpu版本的。这里先**卸载**onnxruntime-gpu。 ## 2 解决办法通过查找onnxruntime社区，可以发现npu已经对onnxruntime进行了适配，参考如下文档：[onnxruntime/docs/execution-providers/comm

开发者 > 博客

作者： zjun

发表时间： 2025-03-10 19:36:53

0

0
ChatTTS适配Ascend NPU开源开发任务

否应用功能依赖于MindSpore运行。否使用MindSpore实现适配逻辑。 torch_npu 是应用功能依赖于torch_npu运行。否使用torch_npu实现适配逻辑。鲲鹏生态指令是使用鲲鹏处理器运行应用。否使用鲲鹏指令实现适配逻辑。 Euler

开发者 > 博客

作者： yd_254538132

发表时间： 2024-10-28 16:45:56

406

0
昇腾NPU人脸仿射变换性能优化
昇腾NPU人脸仿射变换性能优化

数倍再搬移到GPU，做完仿射变换后又做一次搬移，这部分会消耗非常多的资源。   对于这种场景昇腾NPU有什么更好的方案呢？在昇腾NPU方案中，我们可以利用NPU上的媒体处理硬件模块DVPP，以及内置的SpatialTransformer算子结合把整个流程都在芯片内完成。

开发者 > 博客

作者：李万俊

发表时间： 2021-10-21 11:30:52

1665

0
华为NPU单卡训练命令
华为NPU单卡训练命令

!RANK=0 WORLD_SIZE=1 MASTER_ADDR=127.0.0.1 MASTER_PORT=任意端口号\ python 执行脚本 --model 模型名称 --data-path 指定训练数据的路径 --vae 变分自编码器类型\ --global-batch-size

开发者 > 博客

作者： yd_17008982

发表时间： 2025-01-21 10:57:37

88

0
Torch-npu报错定位技巧
Torch-npu报错定位技巧

第二步：在77行代码前每几行就加 torch.npu.synchronize()，再执行有两种可能： 1、代码挂在新增的torch.npu.synchronize() 2、代码没有挂在新增的torch.npu.synchronize() 如果是第一种，则说明真实报错点在新增的torch.npu.synchronize()之前

开发者 > 博客

作者： yd_25562708

发表时间： 2025-01-16 20:07:45

205

0
DeepSpeed 适配Ascend NPU开源开发任务

DeepSpeed 在欧拉操作系统上顺利运行，并能够充分利用其在华为生态系统中的特性。 l 能力要求： - 熟悉深度学习框架（如 PyTorch）以及分布式训练算法。 - 了解 NPU 架构及分布式计算优化。 - 熟悉 Ascend 和 Kunpeng 处理器的硬件架构。 - 熟悉欧拉操

开发者 > 博客

作者： huyanbo

发表时间： 2024-10-28 15:22:17

419

0
RWKV 适配Ascend NPU开源开发任务
RWKV 适配Ascend NPU开源开发任务

域的市场竞争力。能力要求：需要熟悉 Python、C++ 开发，掌握 Ascend 和 Kunpeng 处理器架构，具备深度学习和并行计算的知识，了解 NPU 硬件优化技术。 2.3 适配任务清单生态生态细类是否需要验证验证逻辑说明是否需要适配

开发者 > 博客

作者： huyanbo

发表时间： 2024-10-28 17:54:36

354

0
AntSK适配Ascend NPU开源开发任务
AntSK适配Ascend NPU开源开发任务

MindSpore 否应用功能依赖于MindSpore运行。否使用MindSpore实现适配逻辑。 torch_npu 是应用功能依赖于torch_npu运行否使用torch_npu实现适配逻辑鲲鹏生态指令是使用鲲鹏处理器运行应用。否使用鲲鹏指令实现适配逻辑。 Euler

开发者 > 博客

作者： yd_254538132

发表时间： 2024-10-28 16:29:40

248

0
NPU上如何使能pytorch图模式
NPU上如何使能pytorch图模式

model = Model() # 从TorchAir框架获取NPU提供的默认backend config = torchair.CompilerConfig() npu_backend = torchair.get_npu_backend(compiler_config=config)

开发者 > 博客

作者： zjun

发表时间： 2025-03-24 15:33:38

0

0
flux适配Ascend NPU开源开发任务
flux适配Ascend NPU开源开发任务

2任务目的和范围任务目标：本任务的主要目的是将flux项目适配到华为的昇腾 NPU、鲲鹏 CPU 以及欧拉操作系统（OpenEuler）上。 l 能力要求: - 完成该任务需要具备熟悉C++和python编程 - 有深度学习和CV的算法相关经验 - 熟悉 Ascend 和 Kunpeng 处理器的硬件架构及优化技巧。

开发者 > 博客

作者： huyanbo

发表时间： 2024-10-28 16:54:20

370

0
NPU
NPU

成。同样，现在刚好是神经网络，机器学习处理需求爆发的初期。传统的CPU，GPU也可以做类似的任务，但是，针对神经网络特殊优化过的NPU单元，性能会比CPU，GPU高得多。渐渐的，类似的神经网络任务也会由专门的NPU单元来完成。之后，为什么NPU的效率会比CPU/GPU高很多呢？主

开发者 > 其他

作者：柠檬PH=2

940

3
NPU上PyTorch模型训练问题案例
NPU上PyTorch模型训练问题案例

test_cpu() torch_npu.npu.set_device("npu:0") test_npu() 在运行backward运算时，若没有设置device，程序会自动默认初始化device为0，相当于执行了set_device("npu:0")。由于目前不支持切换d

开发者 > 博客

作者：昇腾CANN

发表时间： 2023-09-26 14:59:39

141

0
SAM 2适配Ascend NPU开源开发任务
SAM 2适配Ascend NPU开源开发任务

大 Ascend 和 Kunpeng 处理器的市场影响力。能力要求：- 熟悉 C++ 和 Python 编程- 具备深度学习和分割算法相关经验- 了解 NPU 架构及并行计算优化- 熟悉 Ascend 和 Kunpeng 处理器的硬件架构及优化技巧   2.3 适配任务清单

开发者 > 博客

作者： huyanbo

发表时间： 2024-10-28 18:13:23

376

0
NPU上PyTorch模型调优问题案例
NPU上PyTorch模型调优问题案例

性能调优以下调优步骤基于已完成模型向NPU的迁移。 1、模型脚本开头添加库代码。 import torch_npu import torch_npu.optim 2、找到模型脚本main.py中的优化器定义代码，将原始优化器替换为对应的NPU亲和融合优化器。样例代码如下。原代码：

开发者 > 博客

作者：昇腾CANN

发表时间： 2023-10-12 10:49:43

10

0
rk3588使用npu进行模型转换和推理，加速AI应用落地

来，使用开发板自带的NPU进行加速推理，岂不是更加可行，而且它本身就是深度学习嵌入式板子，不用NPU真的可惜。 🏅问题来了：怎么使用NPU？在开发板上还是在自己的PC上？要安装什么环境？怎么安装？这些问题都需要依次考虑清楚。因为我在此之前也没有接触过NPU，所以为此做了很多功

开发者 > 博客

作者：振华OPPO

发表时间： 2022-09-15 12:34:43

879

0
基于TensorFlow模型迁移到Ascend 910（NPU）调优过程简述

下面是Profiling，这方面我没什么好的优化办法，上面提到的同学提出了一些方法，可以到上面帖子中参考。总的来说，Ascend 910（NPU）和GPU各有优势，得益于AI Core的先天性优势，一般来说比GPU是要快的，但GPU的生态更加完善，这也是目前昇腾所努力的，经过黄金赛

开发者 > 博客

作者： Tianyi_Li

发表时间： 2021-07-29 05:44:54

3020

0
Faiss适配Ascend NPU开源开发任务
Faiss适配Ascend NPU开源开发任务

l 能力要求： - 熟练掌握GaussDB- 熟悉 C++ 和 Python 编程- 具备大规模数据处理及搜索算法相关经验- 了解 NPU 架构及并行计算优化   - 熟悉 Ascend 和 Kunpeng 处理器的硬件架构及优化技巧 2.3 适配任务清单

开发者 > 博客

作者： huyanbo

发表时间： 2024-10-28 16:31:57

134

0
pytorch模型转换为rknn模型，使用npu推理

🎯模型推理：能够在 PC 上模拟Rockchip NPU 运行 RKNN 模型并获取推理结果；或将 RKNN模型分发到指定的 NPU 设备上进行推理并获取推理结果。 🏋性能和内存评估：将 RKNN 模型分发到指定 NPU 设备上运行，以评估模型在实际设备上运行时的性能和内存占用情况。

开发者 > 博客

作者：振华OPPO

发表时间： 2022-11-30 12:36:06

199

0
npu内存释放
npu内存释放

1,程序运行后，用npu-smi info 显示npu使用了X2.待程序结束后，用ps -aux 查看，无法找到此进程，但npu使用率并未降低3.想请问如何释放npu已经使用的内存

开发者 > 其他

作者：无边落木

1886

5

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

传统深度学习算法能运行在NPU上吗？

NPU上运行onnxruntime

ChatTTS适配Ascend NPU开源开发任务

昇腾NPU人脸仿射变换性能优化

华为NPU单卡训练命令

Torch-npu报错定位技巧

DeepSpeed 适配Ascend NPU开源开发任务

RWKV 适配Ascend NPU开源开发任务

AntSK适配Ascend NPU开源开发任务

NPU上如何使能pytorch图模式

flux适配Ascend NPU开源开发任务

NPU

NPU上PyTorch模型训练问题案例

SAM 2适配Ascend NPU开源开发任务

NPU上PyTorch模型调优问题案例

rk3588使用npu进行模型转换和推理，加速AI应用落地

基于TensorFlow模型迁移到Ascend 910（NPU）调优过程简述

Faiss适配Ascend NPU开源开发任务

pytorch模型转换为rknn模型，使用npu推理

npu内存释放

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线