内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • AIoT在线训练

  • 为什么华为云上AI训练必须设置NCCL_IB_TC=128

      一、网络组网 云上用于大规模AI训练的GPU服务器,一般会带2种网卡。1种接 VPC 普通网络平面,另1种接主机之间高速通信平面(AI 训练也把这个叫参数交换平面,后面简称「参数面网络」)。如下:   对应GPU服务器内可以看到:(第1个是vpc网卡,第2个是RoCE网卡)

    作者: tsjsdbd
    发表时间: 2023-05-30 16:27:06
    93
    0
  • ShowTrainingJobEngines 获取训练作业支持的AI预置框架 - API

    该API属于ModelArts服务,描述: 获取训练作业支持的AI预置框架。接口URL: "/v2/{project_id}/training-job-engines"

  • ModelArts黑科技揭秘|弹性训练,让训练资源张弛有度

    pfs-day,训练费用高达1200万美金。 如果AI开发者想要使用大数据来训练模型,就需要超强的算力,同时不得不支付高昂的训练费用。这就导致AI进入产业的门槛变高,开发者想要做出优秀的AI模型就不得不在算力和成本之间折中。 一方面,在预算投入有限的情况下,AI开发者只能使用较弱

    作者: 技术火炬手
    发表时间: 2020-12-28 02:30:52
    2533
    1
  • 【2023 · CANN训练营第一季】昇腾AI入门课(Pytorch)——昇腾AI入门课(下)

    执行如下命令,生成的可执行文件main在“样例目录/out“目录下。 make 运行环境 切换到可执行文件main所在的目录 cd ../../../out/ 给该目录下的main文件加执行权限。 chmod +x main 运行可执行文件 ./main 出现以下信息代表执行成功

    作者: STRUGGLE_xlf
    发表时间: 2023-04-19 01:05:10
    66
    0
  • yolov3_darknet53训练自己的训练

    trainval, test = train_test_split(files, test_size=ratio) train, val = train_test_split(trainval, test_size=0.1) print('训练集数量: '

    作者: ~哒浪
    发表时间: 2021-04-16 10:50:03
    2135
    0
  • 手把手教你在昇腾平台上搭建PyTorch训练环境

    安装驱动和固件 1. 创建驱动运行用户HwHiAiUser。 groupadd -g 1000 HwHiAiUser useradd -g HwHiAiUser -u 1000 -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash 2.

    作者: 昇腾CANN
    发表时间: 2023-05-25 14:37:44
    1610
    0
  • 训练bencharmark】【yolov3-tf】启动训练,报错 initial ge failed

    tf_adapter/kernels/geop_npu.cc:320] [GEOP] Initialize ge failed, ret :failed:::ABK 1.0.0 yolov3 train failed

    作者: 登山不要怕
    2537
    3
  • 【java_蓝桥杯算法训练 】试题 算法训练 阶乘

    试题 算法训练 阶乘 资源限制 时间限制:1.0s   内存限制:512.0MB 问题描述   一个整数n的阶乘可以写成n!,它表示从1到n这n个整数的乘积。阶乘的增长速度非常快,例如,13!就已经比较大了,已经无法存放在一个整型变量中;而35!就更大了,它已经无法

    作者: 昵称:
    发表时间: 2022-02-22 14:02:54
    372
    0
  • 【java_蓝桥杯算法训练】算法训练 阿尔法乘积

    面我们看下实际的代码演示: import java.util.Scanner; public class Main { public static void main(String[] args) { // TODO Auto-generated method stub

    作者: 昵称:
    发表时间: 2022-02-24 14:48:33
    406
    0
  • 模型训练(预置算法-新版训练

    模型训练(预置算法-新版训练) 使用AI Gallery的订阅算法实现花卉识别 使用时序预测算法实现访问流量预测 使用强化学习内置环境实现车杆游戏 使用强化学习自定义环境实现贪吃蛇游戏

  • AI前沿理论】1分钟训练百万级别节点嵌入,加拿大Mila研究所开源图嵌入训练系统GraphVite

    期 FAIR 的 PyTorchBigGraph 系统,单机多卡的设计更有助于学界的普及使用。该系统所支持的超大规模图训练将会为工业应用带来不少机遇。GraphVite 为什么那么快GraphVite 根据 CPU 和 GPU 各自体系结构的特点,将图嵌入训练分为采样和训练两个部分,分别交由

    作者: HWCloudAI
    发表时间: 2019-08-09 09:11:12
    4670
    0
  • 【java_蓝桥杯算法训练】算法训练 新生舞会

    "F"。 java代码如下: import java.util.Scanner; public class Main { public static void main(String[] args) { // TODO Auto-generated method stub

    作者: 昵称:
    发表时间: 2022-02-23 12:42:40
    393
    0
  • “超级AI助手:全新提升!中文NLP训练框架,快速上手,海量训练数据,ChatGLM-v2、中文Bloom、助您实现更智能的应用

    6倒是可以。 下一步优化方向 😆 添加lora等微调训练代码,这个简单,等后面都训练好了,我添加一下。 模型训练情况 训练数据:BelleGroup/train_1M_CN 训练时间:280小时左右 训练设备:4台3090 更多 当前的模型参数是3b,

    作者: 汀丶
    发表时间: 2023-08-25 10:07:11
    41
    0
  • PyTorch进阶训练技巧

    mnasnet1_0() 传递pretrained参数 通过True或者False来决定是否使用预训练好的权重,在默认状态下pretrained = False,意味着我们不使用预训练得到的权重,当pretrained = True,意味着我们将使用在一些数据集上预训练得到的权重。 import

    作者: livingbody
    发表时间: 2022-11-21 16:53:41
    160
    0
  • 将你训练AI部署为在线服务

    击左上角“部署”,进入“部署”页面。在“部署”页面,填写在线服务相关参数。更多填写资源池和AI应用配置等关键信息,详情请参见部署为在线服务_AI开发平台ModelArts_推理部署_部署AI应用(在线服务)_华为云 (huaweicloud.com)

    作者: 运气男孩
    21
    0
  • 裸机使用容器镜像训练迁移到ModelArts环境训练的方法

    裸机与ModelArts上使用的区别和改造方案: 自定义容器在ModelArts上训练和本地训练的区别如下图: 实际上带来的工作量就是我们需要完成OBS和容器环境的数据迁移工作。增加了和OBS交互工作的整个训练流程如下: 训练数据、代码、模型下载。(本地使用硬盘挂载或者docker cp,在

    作者: yangzilong
    发表时间: 2021-07-08 07:34:09
    1710
    1
  • 【2020华为云AI实战营】使用 ModelArt Notebook 训练"作诗"机器人

      def main():    run_training()if __name__ == '__main__':    # 清空计算图的命令, 再次运行训练是, 必须先清空计算图, 否则可能出现变量重复定义    tf.reset_default_graph()使用训练好的模型,

    作者: TaiShan
    发表时间: 2020-09-02 12:02:21
    5024
    0
  • 昇腾AI训练营——众智专场

    作者: pengcheng20320
    57
    2
  • AI模型预训练技术前瞻

    本期直播分享预训练大模型的主流方法,透过适用场景与应用汇总带你洞察业界趋势。

    主讲人:丁老师 华为AI算法工程师
    直播时间:2022/09/27 周二 19:00 - 20:30