搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

使用Srilm训练N-gram语言模型
使用Srilm训练N-gram语言模型

peechocean-train.txt -order 4 -write speechocean-train-4gram.count2. ngram模型训练执行命令训练1gram语言模型ngram-count -read speechocean-train-1gram.count

开发者 > 博客

作者：作家小然

发表时间： 2020-07-09 11:42:12

13866

0
SoftCOM AI-专注通信领域一站
SoftCOM AI-专注通信领域一站

们又加上了AI，进一步变成了SoftCOM+AI。我们希望把网络往Intelligent这个方向去发展，去迁移。那我们怎么去实现呢？第一步：我们需要让云端的AI模型训练平台能持续地接入到网络层，将获取到的数据进行实时地训练并将训练得到的模型实时更新。然后将更新后的模型部署到我们完

开发者 > 博客

作者： zylsimon

发表时间： 2019-11-26 19:44:41

11044

0
大模型训练故障异构弹性恢复技术

背景介绍随着大模型技术的发展和其训练规模的不断扩大，集群的故障问题也日益凸显，严重影响模型训练的效率；例如，Meta AI实验室发布的OPT模型，其中OPT-175B[1]的训练时长90天( 900多张GPU)，训练期间112次故障，故障恢复时间耗时长，最长一次甚至到80小时；OpenAI

开发者 > 博客

作者： yd_257193061

发表时间： 2025-01-24 14:58:27

0

0
MindSpore 1.0.0 模型训练报错
MindSpore 1.0.0 模型训练报错

使用MindSpore1.0.0版本进行模型训练时，在model.train()后报错如下：----> 1 model.train(config.epochs, train_dataset, callbacks=cb, dataset_sink_mode=False)~/.vir

开发者 > 其他

作者： yd_269829970

536

3
「超全」麻省理工音频预训练模型

音频和语音预训练模型什么是预训练模型？预训练模型是由其他人创建的用于解决类似问题的模型。我们可以使用在其他问题上训练的模型作为起点，而不是从头开始构建模型来解决类似的问题。预训练模型在您的应用程序中可能不是 100% 准确。 Github地址：

开发者 > 博客

作者：府学路18号车神

发表时间： 2021-12-24 16:12:36

506

0
使用Python实现深度学习模型：迁移学习与预训练模型

迁移学习的基本思想是利用在大规模数据集（如ImageNet）上训练好的模型，将其知识迁移到特定的目标任务中。迁移学习通常包括以下步骤：加载预训练模型：使用已经在大规模数据集上训练好的模型。微调模型：根据目标任务的数据集对模型进行微调。实现步骤步骤 1：导入所需库首先，我们需要

开发者 > 博客

作者： Echo_Wish

发表时间： 2024-05-21 12:46:22

15

0
玩转Ascend310模型推理(一)模型训练与离线转换

2}) 执行训练: python3 train.py keras模型 keras模型为高度抽象模型，不需要像RAW模型那样定义底层变量，在构图中手动计算参数变量与tensor的关系，一切通过抽象好的模型叠加即可，参数在keras内部自动定义和计算，基本由构图和训练两部即可完成。

开发者 > 博客

作者： wangkai86

发表时间： 2020-12-10 21:08:44

10283

2
【基于CloudIDE的AI模型训练Codelab体验分享】

on5、填写的时候记得单引号里面不能有空格，在网页里面复制经常前面会带一个空格6、使用ModelArts SDK进行训练作业7、modelarts控制台能看到训练相关信息并且在线服务里面也部署好8、进行在线预测测试手写数字数据，来源于MUIST数据集，童鞋们可以直接用

开发者 > 其他

作者： chenzeshi

4091

10
大模型LLM之分布式训练
大模型LLM之分布式训练

个月翻倍的摩尔定律。为了能够满足机器学习模型的发展，只有通过分布式训练系统才可以匹配模型不断增长的算力需求。图2 机器学习模型参数量增长和计算硬件的算力增长对比分布式训练的总体目标就是提升总的训练速度，减少模型训练的总体时间。总训练速度可以用如下公式简略估计：总训练速度&prop; 单设备计算速度×

开发者 > 博客

作者：码上开花_Lancer

发表时间： 2024-05-06 15:02:03

35

0
AI——自然语言预训练模型(Bert模型)之Transformer详解

这个机制从两个方面增强了注意力层的表现：增加了模型将注意力集中在多个不同位置的能力muti-headed attention可以使我们拥有多组的 Query/Key/Value 权重矩阵（论文中是8组）。每一组都随机初始化经过训练之后，能够将输入的词向量转化为具有不同代表意义的子空间（different

开发者 > 博客

作者： jimmybhb

发表时间： 2019-10-24 18:41:50

5945

0
Lenet5模型的训练和推理
Lenet5模型的训练和推理

项目的目录分为两个部分：学习笔记readme文档，以及其中一些模型的简单实现代码放在train文件夹下。 ├── train # 相关代码目录 │ ├── net.py # LeNet5模型网络代码 │ ├── train.py # LeNet5模型训练代码 │ └── test

开发者 > 博客

作者： yd_255338811

发表时间： 2024-05-06 22:23:53

20

0
「超全」麻省理工OpenCV预训练模型全集

Pre-Trained Model 包括了在Tensorflow，Pytorch等多个平台上的预处理模型什么是预训练模型？预训练模型是由其他人创建的用于解决类似问题的模型。我们可以使用在其他问题上训练的模型作为起点，而不是从头开始构建模型来解决类似的问题。预训练模型在您的应用程序中可能不是

开发者 > 博客

作者：府学路18号车神

发表时间： 2021-12-24 16:46:33

909

0
如何用华为网络人工智能交互式特征工程工具，进行数据分析处理

为网络AI开发专家，负责NAIE模型训练服务特征工程相关的设计与开发工作，9年电信领域软件设计开发工作经验，熟悉分布式系统、大数据、中间件等产品及技术应用，对电信领域AI模型训练平台及数据特征处理有较深入的理解。后希旭，华为网络AI开发专家，知乎专栏主编，负责华为网络AI开发平台的构建和运营，熟悉模型训练和在线推理。

开发者 > 其他

作者：泽宇-Li

3631

1
《AI安全之对抗样本入门》—3.6　使用预训练模型

带有预训练权重的Keras模型，这些模型可以用来进行预测、特征提取。模型的预训练权重将下载到~/.keras/models/并在载入模型时自动载入。图3-9　小猪示例图片加载需要的Python库，并对图像进行预处理。使用基于Imagenet数据集训练的ResNet50模型，图片大小转换成（224

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-17 18:23:13

8307

0
数学建模学习（68）：机器学习训练模型的保存与模型使用

机器学习模型通常需要数小时或数天才能运行，尤其是在具有许多特征的大型数据集上。如果你的机器坏了，你会丢失你的模型，你需要从头开始重新训练它。 Pickle 是一个有用的 Python 工具，可让你保存模型，最大限度地减少冗长的重新训练，并允许你共享、提交和重新加载预先训练的机器学习模型。

开发者 > 博客

作者：川川菜鸟

发表时间： 2022-05-18 16:01:31

292

0
DeepSeek NSA：突破数据瓶颈，开启AI模型训练新范式

传统深度学习的成功往往依赖于“数据量越大，模型性能越好”的缩放定律，但现实中高质量数据的获取成本极高，尤其在医疗、金融等垂直领域。DeepSeek NSA的核心创新在于将数据生成与模型训练深度融合：动态数据合成引擎：通过预训练模型分析现有数据分布，生成符合任务需求的高质量合成数据，同时引入对抗性样本以增强鲁棒性；

开发者 > 博客

作者：码事漫谈

发表时间： 2025-02-18 22:41:35

0

0
【开发者空间实践指导】基于Spotlight的电商推荐模型训练

此案例基于某网站用户数据集训练的模型，可用于该网站这些用户的商品推荐，同类电商产品可以基于自己的用户数据训练此模型，使用训练好的模型应用于系统内从而在平台达到一个较好的用户推荐性能。本次对于推荐模型的训练实验就已完成，开发者可以通过这个训练实验体验深度学习算法进行模型的创建、训练以及测试的过

开发者 > 博客

作者：开发者空间小蜜蜂

发表时间： 2025-01-07 15:16:57

146

0
基于ModelArts的模型训练
基于ModelArts的模型训练

根据训练准备工作复杂度的不同，ModelArts的训练方式分为下面三种：ModelArts的模型训练的三种方式示意图(1)使用预置算法训练。ModelArts已经预置了丰富的预置算法,开发者可以直接订阅并启动训练。这也是最快的训练方式。(2)使用自定义算法训练。如果 ModelArts预置算法不能满足开发者的需求

开发者 > 其他

作者：运气男孩

829

5
【开发者空间实践】云主机安装Docker并制作自定义镜像在ModelArts平台做模型训练

三、实验流程说明： 1、在云主机上安装docker； 2、制作模型训练镜像并上传到SWR； 3、在云主机创建训练脚本，使用浏览器打开OBS服务，上传训练脚本； 4、在ModelArts平台创建训练作业完成模型训练。实验资源本次实验花费总计约1元，资源采取按需计费，点击链接，

开发者 > 博客

作者：开发者空间小蜜蜂

发表时间： 2024-10-14 09:41:08

614

0
【MindSpore】模型训练速度极慢
【MindSpore】模型训练速度极慢

【操作步骤&问题现象】网络模型是从 pytorch 版本迁移过来的，前几个 step 的 loss 都差不多，但训练速度比 pytorch 版慢了近20倍。查阅相关经验后发现可能是因为 GroupNorm 的运行速度过慢，如果转换成 float16 会快很多。但直接将整个模型转成 float16

开发者 > 其他

作者： yd_272736817

1454

14

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Srilm训练N-gram语言模型

SoftCOM AI-专注通信领域一站

大模型训练故障异构弹性恢复技术

MindSpore 1.0.0 模型训练报错

「超全」麻省理工音频预训练模型

使用Python实现深度学习模型：迁移学习与预训练模型

玩转Ascend310模型推理(一)模型训练与离线转换

【基于CloudIDE的AI模型训练Codelab体验分享】

大模型LLM之分布式训练

AI——自然语言预训练模型(Bert模型)之Transformer详解

Lenet5模型的训练和推理

「超全」麻省理工OpenCV预训练模型全集

如何用华为网络人工智能交互式特征工程工具，进行数据分析处理

《AI安全之对抗样本入门》—3.6　使用预训练模型

数学建模学习（68）：机器学习训练模型的保存与模型使用

DeepSeek NSA：突破数据瓶颈，开启AI模型训练新范式

【开发者空间实践指导】基于Spotlight的电商推荐模型训练

基于ModelArts的模型训练

【开发者空间实践】云主机安装Docker并制作自定义镜像在ModelArts平台做模型训练

【MindSpore】模型训练速度极慢

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线