搜索_华为云

分享深度学习的BERT和微调NLP模型

们希望这个模型能够比必须从头开始训练的模型表现得更好。同样地，一个已经学会预测句子里的下一个单词的模型，也应该对人类语言模式有一定的了解。我们可能期望这个模型可以作为翻译或情感分析等相关任务的好的初始化模型。预训练和微调在计算机视觉和自然语言处理中都已有了成功的应用。虽然

开发者 > 其他

作者：初学者7000

850

1

无监督学习：深度生成模型

 图像领域的深度生成技术 基于神经网络的深度学习技术  变分自编码器包括编码器和解码器  对抗生成网络包括生成器和判别器  主流场景包括：虚拟图像生成、风格迁移、图像超分、虚拟视频生成、音乐生成、文字生成图像等。

开发者 > 其他

作者：可爱又积极

1069

2

斯坦福DAWNBench深度学习训练及推理榜单：华为云ModelArts拿下双料冠军

领域。随着深度学习模型越来越大，所需数据量越来越多，所需的AI算力资源和训练时间越来越长，深度学习的训练和推理性能将是重中之重。斯坦福大学DAWNBench是全球人工智能领域最权威的竞赛之一，是用来衡量端到端的深度学习模型训练和推理性能的国际权威基准测试平台，相应的排行榜反映了当前业界深度学习平台技术的领先性。

其他

深度学习基础：7.模型的保存与加载/学习率调度

模型的保存与加载模型的保存和加载，本质上都是针对模型的参数。模型参数在Pytorch中，可以使用state_dict()查看模型的参数信息。例如：输入 model.state_dict() 输出

开发者 > 博客

作者： zstar

发表时间： 2022-08-05 16:41:15

151

0

深度学习——VGG16模型详解-转载

负责进行特征的提取，最后的3层全连接层负责完成分类任务。 2、VGG16的卷积核 VGG使用多个较小卷积核（3x3）的卷积层代替一个卷积核较大的卷积层，一方面可以减少参数，另一方面相当于进行了更多的非线性映射，可以增加网络的拟合/表达能力。卷积层全部都是3*3的卷积核，用上图

开发者 > 其他

作者：泽宇-Li

69

2

走近深度学习，认识MoXing：模型定义教程

snet_v1_50/1/。当导出模型的目录下有多个版本号的模型时，如1，2，99，TF-Serving会自动选取数字最大99的模型做预测，当一个作业往该目录下继续输出了模型100，TF-Serving预测服务不需要重启，自动切换到100的模型上。在MoXing中，mox.ExportSpec(

开发者 > 博客

作者：云上AI

发表时间： 2018-08-22 10:17:48

6783

0

《Keras深度学习实战》—2.6.2　模型类型

2.6.2　模型类型Keras有两种模型类型：序贯模型使用函数API创建的模型

开发者 > 博客

作者：华章计算机

发表时间： 2019-06-15 12:27:44

7393

0

深度学习计算服务平台

深度学习计算服务平台是中科弘云面向有定制化AI需求的行业用户，推出的AI开发平台，提供从样本标注、模型训练、模型部署的一站式AI开发能力，帮助用户快速训练和部署模型，管理全周期AI工作流。平台为开发者设计了众多可帮助降低开发成本的开发工具与框架，例如AI数据集、AI模型与算力等。

云商店

商家: 中科弘云科技（北京）有限公司

交付方式: License

训练物体检测模型 - AI开发平台ModelArts

accuracy：准确率所有样本中，模型正确预测的样本比率，反映模型对样本整体的识别能力。 f1：F1值 F1值是模型精确率和召回率的加权调和平均，用于评价模型的好坏，当F1较高时说明模型效果较好。同一个自动学习项目可以训练多次，每次训练会注册一个新的模型一个版本。如第一次训练版本号为“0

帮助中心 > AI开发平台ModelArts > ModelArts Standard用户指南 > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测

为什么构建深度学习模型需要使用GPU

在深度学习中，深度学习模型有两个主要的操作，也就是前向传递和后向传递。前向传递将输入数据通过神经网络后生成输出；后向传递根据前向传递得到的误差来更新神经网络的权重。在矩阵中，我们知道计算矩阵就是第一个数组的行与第二个数组的列元素分别相乘。因此，在神经网络中，我们可以将第一个矩阵视

开发者 > 其他

作者： yyy7124

844

1

华为云hilens

HiLens平台提供AI应用开发在推理阶段的工具、插件，开发者可以选择用其完成开发调试，最后通过HiLens平台部署到设备上运行和管理。开发流程数据预处理和模型训练用户在华为云ModelArts平台或线下，进行数据预处理、算法开发和模型训练，得到模型后，根据需要部署的设备芯片类型，完成对应的模型转换。 AI应用开发

产品

在ModelArts自动学习中模型训练图片异常怎么办？ - AI开发平台ModelArts

在ModelArts自动学习中模型训练图片异常怎么办？使用自动学习的图像分类或物体检测算法时，标注完成的数据在进行模型训练后，训练结果为图片异常。针对不同的异常情况说明及解决方案参见表1。表1 自动学习训练中图片异常情况说明（图像分类和物体检测）序号图片异常显示字段图片异常说明

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习

深度学习优化解密Sora模型的SOTA技术

深度学习优化解密Sora模型的SOTA技术深度学习作为人工智能的核心技术之一，近年来在多个领域取得了突破性的进展。在众多的深度学习模型中，Sora模型因其出色的性能和创新的架构在行业中脱颖而出。本文将深入探讨Sora模型的SOTA技术，解析其设计理念，并通过代码示例展示其实现方法。

开发者 > 博客

作者：柠檬味拥抱1

发表时间： 2025-03-22 13:37:55

0

深度强化学习模型优化算法综述

将综述深度强化学习模型优化算法的发展及其在实际应用中的应用情况。 I. 引言深度强化学习模型的优化算法是指在训练深度神经网络的同时，结合强化学习框架，使智能体能够从环境中学习到最优策略。优化算法的选择直接影响了模型的性能和训练效率。本文将介绍几种主流的深度强化学习模型优化算法

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-05-20 14:44:53

5

0

使用Python实现深度学习模型：序列建模与生成模型的博客教程

序列建模模型的训练与评估生成模型的基本概念使用Python和TensorFlow构建生成模型生成模型的训练与生成新的序列总结与展望 1. 序列建模的基本概念序列建模是一种用于处理序列数据的技术，例如文本、音频和时间序列数据。它的目标是通过学习数据中的模式和规律，从而能

开发者 > 博客

作者： Echo_Wish

发表时间： 2024-07-02 09:31:54

0

分享适合科学研究深度学习模型（一）

姿势估计也能看做卷积神经网络的应用，重点在于图片中人物的关键节点，例如膝盖、手肘、头部等。2D的姿势估计是计算机的核心问题，此类的数据集和卷积架构也比较多，早期的堆叠沙漏网络结构衍生的各种变种算法，牢牢占据了姿态检测的半壁江山。最近的网络 HRNet，能够通过并行连接高分辨率到

开发者 > 其他

作者：初学者7000

1139

4

深度学习优化策略-提升模型性能的关键技术

深度学习优化策略：提升模型性能的关键技术1. 引言深度学习模型的优化是人工智能研究的重要组成部分。无论是在图像识别、自然语言处理还是自动驾驶领域，优化策略直接影响模型的性能。本文将介绍几种常见的深度学习优化技术，并附带代码示例，帮助读者理解如何在实际项目中应用这些优化方法。2. 学习率调整策略学习率（Learning

开发者 > 其他

作者：柠檬味拥抱

39

7

分享适合科学研究深度学习模型（五）

之前的方法能够解决大多数的深度学习问题，但是偶尔会求助到更高级的深度学习方法，特别是生成模型和强化学习。不过这些方法通常需要更复杂的实现，可能需要问题的特定属性才能有用，例如强化学习对优秀环境模型/模拟器要求比较高。生成性建模有两个基本目标。首先，从高维数据分布（如自然图

开发者 > 其他

作者：初学者7000

1939

6

使用Python实现深度学习模型：语言模型与文本生成

在本文中，我们详细介绍了语言模型的基本原理，并使用Python和TensorFlow实现了一个基于GPT-2的文本生成模型。通过本文的教程，希望你能够理解语言模型的工作原理和实现方法，并能够应用于自己的任务中。随着对语言模型和自然语言处理技术的理解加深，你可以尝试实现更复杂的生成任务，如对话系统、诗歌生成等。

开发者 > 博客

作者： Echo_Wish

发表时间： 2024-06-25 22:13:48

6

0

深度学习核心技术精讲100篇（五）-通过CTR预估对比深度学习模型（deepfm）梯度提升模型（catboost）

DeepCTR 简介深度学习解决CTR模型天然的会有这些优势：数据稀疏的问题采用深度模型似乎会有着不错的效果。特征之间的组合关系可以采用深度学习模型自动提取。一些经典的FM,LR模型可以和深度学习模型做结合，能够产生出更好的效果。这里我先介绍一下Deep

开发者 > 博客

作者：格图洛书

发表时间： 2021-11-18 16:02:36

736

0

意见反馈