已找到以下 10000 条记录
  • 《C++与 ONNX:构建跨平台推理引擎的智慧融合》

    解决方案包括采用针对特定硬件的加速库,如利用 CUDA 库在 NVIDIA GPU 上加速计算,或者使用 OpenMP 进行多线程优化,充分发挥多核 CPU 的性能。同时,对算法进行优化,如采用更高效的矩阵乘法算法、优化内存访问模式等,也能显著提高推理性能。 

    作者: 程序员阿伟
    发表时间: 2024-12-18 23:03:25
    98
    0
  • CCE集群高可用部署指导

    https://support.huaweicloud.com/usermanual-cce/cce_01_0028.html 2)购买鲲鹏集群:https://support.huaweicloud.com/usermanual-cce/cce_01_0121.html 3)购买GPU

    作者: 云技术搬运工
    发表时间: 2021-01-28 11:00:59
    9482
    2
  • 【体验活动】案例二:ModelArts + HiLens 端云协同,开发手势识别AI应用实验过程及心得体会

    然后就是算法的训练过程,在使用免费一小时的gpu进行训练的时候,配置完训练任务进行提交的时候也要保证账户里边是有余额的,不然点击提交按钮没有任何的反应(我觉得弹出个余额不足的框提示下用户会更好)    训练的时候会报错(如下),我重新建立了一个训练任务,第二次训练就没有这个错误了

    作者: xinfa
    1851
    1
  • 【云小课】基础服务第52课 OBS超实用技能—片处理,你会用吗?

    片处理(Image Processing)是对象存储服务OBS为用户提供的安全、易用、低成本的片处理服务。对于存储在OBS中的片,可以创建片样式模板或传入片处理参数对片进行处理,包括:片瘦身、片剪切、片缩放、片水印、格式转换等。

    作者: 云小萌
    发表时间: 2020-07-10 10:37:10
    10476
    9
  • 双第一!华为FusionPlant为工业企业打造高质量发展的数字底座

    在AI、并行调度、GPU加速等核心技术的基础上,华为云携手众多科学家和行业专家,在云上构建几何模型建模、形渲染、数据模型驱动等十大工业软件内核引擎及工业基础资源库,让工业软件伙伴少走弯路、减少重复投资,实现弯道超车。

    作者: 华为云头条
    发表时间: 2022-12-14 10:55:49
    851
    0
  • 海思Hi3519DV500部署paddle版面分析算法

    /image/DBnet_test.jpg \    --device=GPU   可以看到准确度已经有很大的提升了,重新部署到板端 重新训练后板端的的测试结果   可以看到准确度提升很多;

    作者: warren_伟
    发表时间: 2024-02-27 15:40:38
    505
    0
  • Prompt-“设计提示模板:用更少数据实现预训练模型的卓越表现,助力Few-Shot和Zero-Shot任务”

    在 logs/sentiment_classification 文件下将会保存训练曲线: 2.3.

    作者: 汀丶
    发表时间: 2023-08-21 20:54:07
    43
    0
  • 一次训练、多端部署——华为提出宽度和深度可伸缩的动态预训练模型DynaBERT

    6:Kirin810 ARM CPU上时延和精度的对比。 6是DynaBERT的比较和DynaRoBERTa和其他BERT压缩方法在麒麟810 ARM CPU上时延和精度的对比(其他性能约束之下的对比如参数量、FLOPs、NVIDIA GPU时延可以参考论文)。

    作者: Noah's Ark LAB
    发表时间: 2020-08-27 09:35:06
    3836
    0
  • 渲云云桌面渲染行业趋势分析

    GPU加速型:GPU加速实例总览 GPU加速型:GPU加速实例总览 规格清单(X86):GPU加速型 方案概述:应用场景 规格清单(X86):GPU加速型 开始使用:验证步骤 规格清单(X86):GPU加速型 规格清单(X86):GPU加速型 注册账号 开始使用:验证步骤

  • 文心一言 VS 讯飞星火 VS chatgpt (329)-- 算法导论22.5 5题

    package main import ( "fmt" ) // 定义有向的结构 type Graph struct { adj [][]int // 邻接表表示法 } // 新建 func NewGraph(n int) *Graph { g := &Graph

    作者: 福大大架构师每日一题
    发表时间: 2024-08-20 16:38:31
    73
    0
  • 云计算产业链全景地

    从产业化角度以及过去三年GPU服务器的增长情况来看,算力的扩张正处于爆发期。

    作者: 风起云涌1
    1005
    0
  • JMC | 分子生成器的灵测试

    3 方法 3.1 BioDig 基于匹配分子对的算法 3.2 BRICS  基于片段替换的算法 3.3 RG2Smi 一种语言处理机器学习算法,可将Reduced Graph输入转化为SMILES输出。

    作者: DrugAI
    发表时间: 2021-07-14 15:28:01
    1363
    0
  • FinOPS之 基于节点真实负载情况调度之一:crane-scheduler-plus

    在 Crane-scheduler 中,用户可以为候选节点配置任意的评价指标类型(只要从 Prometheus 能拉到相关数据),不论是常用到的 CPU/Memory 使用率,还是 IO、Network Bandwidth 或者 GPU 使用率,均可以生效,并且支持相关策略的自定义配置

    作者: Kubeservice@董江
    发表时间: 2023-06-27 10:26:06
    7
    0
  • k8s 标签和选择器

    标签和选择器 标签(Label)是附加在Kubernetes对象上的一组名值对,其意是按照对用户有意义的方式来标识Kubernetes对象,同时,又不对Kubernetes的核心逻辑产生影响。标签可以用来组织和选择一组Kubernetes对象。

    作者: 未来日记
    发表时间: 2024-04-28 12:54:14
    3
    0
  • 如何使用PyTorch训练LLM

    现在,可以按如下方式导入这些模块: 数据加载和准备 羊驼数据集,在拥抱脸上免费提供,将用于此插。数据集有三个主要列:指令、输入和输出。这些列组合在一起以生成最终文本列。

    作者: yd_217961358
    发表时间: 2023-09-08 21:57:46
    13
    0
  • Understanding topics:理解话题(Topic)

    现在你可以打开 rqt_graph形化的方式查看正在发生什么。

    作者: MAVER1CK
    发表时间: 2023-03-15 14:14:50
    741
    0
  • 文心一言 VS 讯飞星火 VS chatgpt (394)-- 算法导论25.1 8题

    ") } else { fmt.Println("不包含负权重环路") } } 初始化结构 首先创建了一个Graph结构体来表示,其中包含顶点数量V和邻接矩阵graph

    作者: 福大大架构师每日一题
    发表时间: 2024-11-18 13:40:38
    525
    0
  • ModelArts AI Gallery_市场_资产集市

    在线服务 GPU CPU、GPU BERT TensorFlow 在线服务 GPU CPU、GPU、Ascend 310 NEZHA TensorFlow 在线服务 GPU GPU 电诈案件态势感知 TensorFlow 在线服务 GPU CPU、GPU 短信诈骗预警 TensorFlow

  • 浅谈混合精度训练

    计算更快:目前的不少GPU都有针对 fp16 的计算进行优化。论文指出:在近期的GPU中,半精度的计算吞吐量可以是单精度的 2-8 倍; 损失控制原理: 2 实验设计 本次实验主要从两个方面进行测试,分别在精度和速度两个部分进行对比。

    作者: 李长安
    发表时间: 2023-02-16 11:45:41
    105
    0
  • 【NLP】Transformer理论解读

    上面展现了单行句子输入的场景,而在实际过程中,可以利用线性代数中的矩阵乘法,来实现多行句子一起输入并行处理,这样也能够更好得发挥GPU并行计算的性能。

    作者: zstar
    发表时间: 2022-08-06 16:56:55
    262
    0