搜索_华为云

已找到以下 10000 条记录

AI平台ModelArts

ModelArts是面向开发者的一站式AI开发平台，为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成，及端-边-云模型按需部署能力，帮助用户快速创建和部署模型，管理全周期AI工作流。

购买控制台文档

AI平台ModelArts

购买 AI Gallery 1对1咨询

深度学习模型优化
深度学习模型优化

项目实习生深度学习模型优化深度学习模型优化领域方向：人工智能工作地点：深圳深度学习模型优化人工智能深圳项目简介为AI类应用深度学习模型研发优化技术，包括神经网络结构设计，NAS搜索算法，训练算法优化，AI模型编译优化等。岗位职责负责调研深度学习模型优化技术业

其他
四种深度学习模型介绍
四种深度学习模型介绍

深度学习源于神经网络的研究，可理解为深层的神经网络。通过它可以获得深层次的特征表示，免除人工选取特征的繁复冗杂和高维数据的维度灾难问题。目前较为公认的深度学习的基本模型包括：基于受限玻尔兹曼机(Restricted Boltzmann Machine，RBM)的深度信念网络(Deep

开发者 > 其他

作者： QGS

967

0
深度学习模型能力的来源
深度学习模型能力的来源

深度学习模型的能力是训练数据、算法设计（模型架构）和算力三者共同作用的结果，各自的作用不同，且相互依赖。1. 训练数据：能力的“原材料”• 作用：数据是模型学习的直接来源，决定了模型能学到什么。数据的质量（标注准确性、噪声）、多样性（覆盖场景）和规模直接影响模型的泛化能力。• 例

开发者 > 其他

作者：黄生

27

7
深度学习模型结构
深度学习模型结构

目标等），再到更高层的目标、目标的行为等，即底层特征组合成了高层特征，由低到高的特征表示越来越抽象。深度学习借鉴的这个过程就是建模的过程。深度神经网络可以分为3类：1.前馈深度网络(feed-forwarddeep networks, FFDN)，由多个编码器层叠加而成，如多层感知机(multi-layer

开发者 > 其他

作者：运气男孩

1146

2
深度学习模型结构
深度学习模型结构

者目标等），再到更高层的目标、目标的行为等，即底层特征组合成了高层特征，由低到高的特征表示越来越抽象。深度学习借鉴的这个过程就是建模的过程。深度神经网络可以分为3类，前馈深度网络(feed-forwarddeep networks, FFDN)，由多个编码器层叠加而成，如多层感知机(multi-layer

开发者 > 其他

作者： QGS

646

2
深度学习模型训练流程思考
深度学习模型训练流程思考

代码实现6，7，8中的设计使用超参优化工具（NNI）寻找最优超参组合模型初步训练改进：根据初步训练的效果指标判断是数据集问题还是模型结构或深度问题数据集问题，想办法进一步清洗补充数据集模型结构问题，尝试更换或者NNI搜索更优模型；模型深度问题，尝试增加backbone的卷积通道层数或者复制增加layers

开发者 > 博客

作者： lutianfei

发表时间： 2021-05-31 12:10:43

1544

0
部署深度学习模型
部署深度学习模型

虽然modelarts能够帮助我们在线上完成深度学习的模型，但是训练好的深度学习模型是怎么部署的

开发者 > 其他

作者：初学者7000

884

3
深度学习模型编译技术
深度学习模型编译技术

前言深度学习模型的开发周期，包括训练阶段和部署阶段。训练阶段，用户需要收集训练数据，定义自己的模型结构，在CPU或者GPU硬件上进行训练，这个过程反复优化，直到训练出满意精度的模型。有了模型之后，我们需要将模型服务部署运行，我们期望服务延迟越低越好，吞吐越高越好。这里会从编译优

开发者 > 博客

作者： ross.xw

发表时间： 2022-05-06 03:19:25

1373

0
深度学习模型轻量化
深度学习模型轻量化

移动端模型必须满足模型尺寸小、计算复杂度低、电池耗电量低、下发更新部署灵活等条件。模型压缩和加速是两个不同的话题，有时候压缩并不一定能带来加速的效果，有时候又是相辅相成的。压缩重点在于减少网络参数量，加速则侧重在降低计算复杂度、提升并行能力等。模型压缩和加速可以从多个角度来优化。总体来看，个人认为主要分为三个层次：1

开发者 > 其他

作者：可爱又积极

1261

4
【开源模型学习】AlexNet深度学习模型总结

第8层：FC-SoftmaxCaffe AlexNet实现模型结构如下：模型创新点：1. 使用新的激活函数Relu在Relu被使用之前，广泛使用的激活函数是tanh,sigmodtanh:sigmod:（为什么要使用Relu）tanh sigmod这两个激活函数的问题：存在梯度弥散，模型收敛较慢的问题，且无法表征

开发者 > 其他

作者：小二中二大二

1655

0
基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型 - CodeArts IDE Online

基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型概要准备工作导入和预处理训练数据集创建和训练模型使用模型

 帮助中心 > CodeArts IDE Online > 最佳实践
基于TensorFlow的深度学习模型优化策略

通过应用上述优化策略，我们可以观察到模型训练的时间减少，同时模型在测试集上的表现得到提升。例如，数据增强和批量归一化可以有效增加模型的泛化能力；动态学习率和早停机制确保了模型不会过度拟合训练数据；分布式训练则显著加速了训练过程。结论与展望通过上述策略的综合运用，我们不仅能够提高深度学习模型的训练效率

开发者 > 博客

作者：周周的奇妙编程

发表时间： 2024-06-09 13:54:24

17

0
分享适合科学研究深度学习模型

热门的任务已经取得了一些进展。当前需要处理序列数据的核心人物包括：语言建模、序列到序列转换、问答等深度学习模型那么多，科学研究选哪个？序列到序列预测任务的图示语言建模（Next Token Prediction）作为一种训练方法，将时间或者位置t的序列标记作为输入，然后用这些

开发者 > 其他

作者：初学者7000

1261

5
浅谈深度学习模型压缩
浅谈深度学习模型压缩

常见的模型压缩方法有以下几种：模型蒸馏 Distillation，使用大模型的学到的知识训练小模型，从而让小模型具有大模型的泛化能力量化 Quantization，降低大模型的精度，减小模型剪枝 Pruning，去掉模型中作用比较小的连接参数共享，

开发者 > 其他

作者： QGS

40

1
各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

各个模型深度学习训练加速框架的选择 LlamaFactory框架使用两种训练框架： DeepSpeed和Accelerate都是针对深度学习训练加速的工具，但是它们的实现方式和应用场景有所不同。 DeepSpeed是一种深度学习加速框架，主要针对大规模模型和大规模数据集的训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
为什么构建深度学习模型需要使用GPU

在深度学习中，深度学习模型有两个主要的操作，也就是前向传递和后向传递。前向传递将输入数据通过神经网络后生成输出；后向传递根据前向传递得到的误差来更新神经网络的权重。在矩阵中，我们知道计算矩阵就是第一个数组的行与第二个数组的列元素分别相乘。因此，在神经网络中，我们可以将第一个矩阵视

开发者 > 其他

作者： yyy7124

844

1
使用模型 - CodeArts IDE Online
使用模型 - CodeArts IDE Online

敬请期待后续更新。父主题：基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

 帮助中心 > CodeArts IDE Online > 最佳实践 > 基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型
创建和训练模型 - CodeArts IDE Online

epochs=10) 父主题：基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

 帮助中心 > CodeArts IDE Online > 最佳实践 > 基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型
Embedding模型服务 - 盘古大模型 PanguLargeModels

父主题：向量&重排专业大模型

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > 模型推理接口 > 向量&重排专业大模型
导入和预处理训练数据集 - CodeArts IDE Online

plt.show() 父主题：基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

 帮助中心 > CodeArts IDE Online > 最佳实践 > 基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型
概要 - CodeArts IDE Online
概要 - CodeArts IDE Online

Online中使用TensorFlow和Jupyter Notebook完成神经网络模型的训练，并利用该模型完成简单的图像分类。父主题：基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

 帮助中心 > CodeArts IDE Online > 最佳实践 > 基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型
准备工作 - CodeArts IDE Online
准备工作 - CodeArts IDE Online

Editor，可以在里面编辑和运行cell。父主题：基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

 帮助中心 > CodeArts IDE Online > 最佳实践 > 基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消