内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 【ModelArts】模型训练时报错

    【功能模块】ModelArts训练作业中【操作步骤&问题现象】1、执行训练作业时,运行失败报错【截图信息】【日志信息】(可选,上传日志内容或者附件)

    作者: 尹绝言
    722
    3
  • 模型训练出错

    Launch graph failed, graph id: 0 Traceback (most recent call last): File "main_finetune.py", line 312, in main(args) File "main_finetune.py"

    作者: shipz
    2532
    4
  • 昇腾模型训练挑战

  • 【MindSpore1.6.1】【模型训练】inceptionv4模型训练出错

    【功能模块】环境:昇腾910A  driver21.04镜像使用:https://ascendhub.huawei.com/#/detail/mindspore-modelzoo 下21.0.4代码使用:https://gitee.com/mindspore/models/tree/r1

    作者: 橙叶子
    585
    2
  • ModelArts 模型训练自动中止

    你好我想问下普通用户是有训练时长限制吗,我训练作业训练到一半自动停止了,日志中也没有任何错误输出提示,日志见附件,期待你们解答~

    作者: akineeic
    1329
    9
  • 【CANN训练营】CANN训练营_昇腾AI趣味应用实现AI趣味应用(上)随笔

    加载模型文件并构建输出内存:从文件加载离线模型AnimeGAN.om数据,需要由用户自行管理模型运行内存,根据内存中加载模型获取模型基本信息包含模型输入、输出数据数据buffer大小;由模型基本信息构建模型输出内存,为接下来模型推理做好准备。 3.数据预处理:对读入图像数据进行预处理,然后构建模型的输入数据。

    作者: Tianyi_Li
    发表时间: 2022-07-09 07:30:06
    4333
    0
  • 【Mind】【模型训练model.train】训练时间越来越长

    【功能模块】本地CPU,mindspore1.2版本,做MNIST手写体实验,非常简单3层全连接网络。model.train【操作步骤&问题现象】1、模型训练时候,每一步训练时长越来越长2、【截图信息】【日志信息】(可选,上传日志内容或者附件)

    作者: ruperts tear
    746
    3
  • 模型训练速度极慢

    【功能模块】mindspore模型迁移【操作步骤&问题现象】1、第一个版本:10s/step, 通过对模型各个模块测试后发现模型网络计算花费时间为1.5s/step。由于这个版本中对数据加载数据进行了分词等一系列operation,我希望通过简化对数据operation来缩短其他部分时间。因

    作者: Gilbert
    1777
    4
  • 大规模模型训练

    大规模模型训练涉及多GPU时并行、通讯以及模型过大等问题。并行方式对于n个GPU数据并行:不同GPU输入不同数据,运行相同完整模型模型并行:不同GPU运行模型不同部分,比如多层网络不同层;如果模型能够放进单个GPU显存中,可以使用数据并行加速。如果模型不能够放

    作者: AI资讯
    3122
    36
  • 模型训练出错

    美食23分类训练模型出错,日志如下:

    作者: qiheping
    1257
    4
  • 联邦学习,打破模型训练数据安全限制难题

    自数据建立虚拟共有模型,并且共同获益体系4)个性化模型:根据用户特性,提供匹配算法、模型和推理结果5)在用户或特征不对齐情况下,数据间通过交换加密参数达到知识迁移效果2、NAIE平台联邦学习架构及关键特性NAIE联邦学习作为运营商各层AI架构基础在线训练能力:1)遵从A

    作者: 就挺突然
    发表时间: 2021-03-11 15:55:58
    3216
    0
  • 模型训练模型训练过程中,报错shape不匹配

    【问题现象】  模型训练过程中,sess.run时显示shape不匹配  【原因】 batch_size=20,labeltensor是[20,1], 但是predict结果是[20,5],所以label要转为one-hot形式【问题解决】 训练过程中数据集变成one hot形式 

    作者: Tx-
    736
    0
  • tensorflow学习:准备训练数据和构建训练模型

    Variable来声明来创建变量,它是会变,在训练中学习到,所以给它初值是多少是无所谓 然后就是怎么样来训练模型训练模型就是一个不断迭代不断改进过程 首先是训练参数,也就是超参,一个是迭代次数train_epochs,这里设置为10,根据复杂情况,可能上万次都可能。一个是学习率learning_rate,这里默认为0

    作者: 黄生
    发表时间: 2021-05-06 00:46:27
    2047
    0
  • 模型AI巨头角力场

    模型,近期已成为AI产学界高频词汇,显然,人工智能领域已进入“炼大模型”时代。 深度学习技术兴起近10年间,AI模型基本上是针对特定应用场景需求进行训练模型。小模型用特定领域有标注数据训练,通用性差,换到另外一个应用场景中往往不适用,需要重新训练。另外,小模型训练

    作者: RoyalKun
    发表时间: 2021-10-20 03:03:16
    2059
    0
  • 【Atlas300】【模型训练】在服务器上做模型训练优势

    正常流程是否为,在X86平台搭配GPU训练模型,后将训练模型转为Atlas300做模型推理。可否在服务器使用Atlas300完成caffe、caffe2等模型训练,Atlas300可有在模型训练优势。

    作者: bmelo1994
    1048
    5
  • mmdetection在自己数据集上训练检测模型

    和 aimhabo 回答 生成coco json文件代码中 class_name标签名称与 训练代码配置文件和coco.py文件和  测试标签类别文件(eval.py)中classes标签名称要一致。 Ref: 正确跑通自己数据集博客: https://bbs.huaweicloud

    作者: qingchenwuhou
    发表时间: 2021-03-31 11:58:12
    1465
    0
  • mmdetection在自己数据集上训练检测模型

    aimhabo 回答 生成coco json文件代码中 class_name标签名称 与代码中训练代码配置文件、coco.py文件、测试标签类别文件(eval.py)中classes标签名称要一致。 Bug4: mmdet - ERROR - The testing results

    作者: qingchenwuhou
    发表时间: 2021-03-31 12:43:58
    4356
    0
  • Python双色球训练模型

    0001, solver='lbfgs', verbose=10, random_state=1, tol=0.0001) # 训练模型 model.fit(X, y) # 预测下一期开奖号码 next_data = pd.read_csv('next_data.csv')

    作者: 风水道人
    发表时间: 2023-05-04 16:06:02
    13
    0
  • 模型训练出错

    作者: Nikolas
    930
    6
  • 使用ResNet50预置算法训练美食分类模型

    到本地查看。 训练日志中会打印一些训练精度和训练速度等信息。 训练生成模型会放到训练输出位置OBS路径下,可以参考此文档,到OBS中将其下载到本地使用。 模型部署 导入模型 点击“创建模型”按钮,创建模型。 按照如下提示,填写导入模型字段。 名称:自定义

    作者: HWCloudAI
    发表时间: 2022-11-30 03:53:54
    229
    0