搜索_华为云

已找到以下 10000 条记录

AI平台ModelArts

ModelArts是面向开发者的一站式AI开发平台，为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成，及端-边-云模型按需部署能力，帮助用户快速创建和部署模型，管理全周期AI工作流。

购买控制台文档

AI平台ModelArts

购买 AI Gallery 1对1咨询

深度学习模型优化
深度学习模型优化

项目实习生深度学习模型优化深度学习模型优化领域方向：人工智能工作地点：深圳深度学习模型优化人工智能深圳项目简介为AI类应用深度学习模型研发优化技术，包括神经网络结构设计，NAS搜索算法，训练算法优化，AI模型编译优化等。岗位职责负责调研深度学习模型优化技术业

其他
《机器学习模型快速收敛的秘籍大揭秘》

可能会导致模型在训练过程中产生振荡，无法收敛甚至错过最优解；而学习率过小，则会使模型收敛速度过慢。可以采用动态调整学习率的策略，如学习率衰减。随着训练的进行，逐渐降低学习率，这样在训练初期可以利用较大的学习率快速接近最优解，而在后期则通过较小的学习率来进行精细调整，以达到更好的

开发者 > 博客

作者：程序员阿伟

发表时间： 2025-01-02 22:49:13

110

0
深度学习-通用模型调试技巧
深度学习-通用模型调试技巧

确率上限是多少，以此判断模型的准确率还差多远。2、训练时每隔一定步数记录一次训练集错误率和验证集错误率，一直训练，直到在训练集上的错误率不再下降，停止训练；3、计算贝叶斯错误率与训练错误率之差，该差值称为模型偏差，计算训练错误率与验证错误率之差，该差值称为模型方差，将训练时记录的

开发者 > 博客

作者：山海之光

发表时间： 2019-08-08 21:26:02

11278

1
深度学习模型训练流程思考
深度学习模型训练流程思考

代码实现6，7，8中的设计使用超参优化工具（NNI）寻找最优超参组合模型初步训练改进：根据初步训练的效果指标判断是数据集问题还是模型结构或深度问题数据集问题，想办法进一步清洗补充数据集模型结构问题，尝试更换或者NNI搜索更优模型；模型深度问题，尝试增加backbone的卷积通道层数或者复制增加layers

开发者 > 博客

作者： lutianfei

发表时间： 2021-05-31 12:10:43

1544

0
使用Python实现深度学习模型：元学习与模型无关优化（MAML）

总结本文详细介绍了如何使用Python实现深度学习模型中的元学习与模型无关优化（MAML）。通过本文的教程，希望你能够理解MAML的基本原理，并能够将其应用到实际的深度学习任务中。随着对元学习的深入理解，你可以尝试优化更多复杂的模型，探索更高效的元学习算法，以解决更具挑战性的任务。

开发者 > 博客

作者： Echo_Wish

发表时间： 2024-06-30 14:05:23

3

0
深度学习模型结构
深度学习模型结构

者目标等），再到更高层的目标、目标的行为等，即底层特征组合成了高层特征，由低到高的特征表示越来越抽象。深度学习借鉴的这个过程就是建模的过程。深度神经网络可以分为3类，前馈深度网络(feed-forwarddeep networks, FFDN)，由多个编码器层叠加而成，如多层感知机(multi-layer

开发者 > 其他

作者： QGS

646

2
深度学习模型结构
深度学习模型结构

目标等），再到更高层的目标、目标的行为等，即底层特征组合成了高层特征，由低到高的特征表示越来越抽象。深度学习借鉴的这个过程就是建模的过程。深度神经网络可以分为3类：1.前馈深度网络(feed-forwarddeep networks, FFDN)，由多个编码器层叠加而成，如多层感知机(multi-layer

开发者 > 其他

作者：运气男孩

1146

2
【开源模型学习】AlexNet深度学习模型总结

第8层：FC-SoftmaxCaffe AlexNet实现模型结构如下：模型创新点：1. 使用新的激活函数Relu在Relu被使用之前，广泛使用的激活函数是tanh,sigmodtanh:sigmod:（为什么要使用Relu）tanh sigmod这两个激活函数的问题：存在梯度弥散，模型收敛较慢的问题，且无法表征非

开发者 > 其他

作者：小二中二大二

1654

0
部署深度学习模型
部署深度学习模型

虽然modelarts能够帮助我们在线上完成深度学习的模型，但是训练好的深度学习模型是怎么部署的

开发者 > 其他

作者：初学者7000

878

3
各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

各个模型深度学习训练加速框架的选择 LlamaFactory框架使用两种训练框架： DeepSpeed和Accelerate都是针对深度学习训练加速的工具，但是它们的实现方式和应用场景有所不同。 DeepSpeed是一种深度学习加速框架，主要针对大规模模型和大规模数据集的训练。D

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

或者学习率设置得过大，使得模型在最优解附近震荡，甚至跳过最优解，导致无法收敛。您可以尝试提升数据质量或者减小学习率的方式来解决。图3 异常的Loss曲线：上升 Loss曲线平缓，保持高位：Loss保持平缓且保持高位不下降的原因可能是由于目标任务的难度较大，或者模型的学习率设置

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
使用模型 - CodeArts IDE Online
使用模型 - CodeArts IDE Online

敬请期待后续更新。父主题：基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

 帮助中心 > CodeArts IDE Online > 最佳实践 > 基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型
深度学习模型编译技术
深度学习模型编译技术

前言深度学习模型的开发周期，包括训练阶段和部署阶段。训练阶段，用户需要收集训练数据，定义自己的模型结构，在CPU或者GPU硬件上进行训练，这个过程反复优化，直到训练出满意精度的模型。有了模型之后，我们需要将模型服务部署运行，我们期望服务延迟越低越好，吞吐越高越好。这里会从编译优

开发者 > 博客

作者： ross.xw

发表时间： 2022-05-06 03:19:25

1373

0
创建和训练模型 - CodeArts IDE Online

epochs=10) 父主题：基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

 帮助中心 > CodeArts IDE Online > 最佳实践 > 基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型
深度学习LSTM模型
深度学习LSTM模型

长短期记忆（Long short-term memory, LSTM）是一种特殊的RNN，主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。简单来说，就是相比普通的RNN，LSTM能够在更长的序列中有更好的表现。

开发者 > 其他

作者：我的老天鹅

1892

10
AI平台ModelArts入门
AI平台ModelArts入门

-ModelArts介绍 -ModelArts快速入门 AI进阶 -自动学习简介 -预测算法 -使用预置算法构建模型 AI工程师使用ModelArts -使用自定义算法构建模型使用ModelArts VS Code插件进行模型开发了解更多入门指引精品教程助您快速上手体验精品教程助您快速上手体验

产品
基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型 - CodeArts IDE Online

基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型概要准备工作导入和预处理训练数据集创建和训练模型使用模型

 帮助中心 > CodeArts IDE Online > 最佳实践
AI平台ModelArts资源
AI平台ModelArts资源

AI平台ModelArts资源 AI平台ModelArts资源面向开发者的一站式AI开发平台，可快速创建和部署模型，管理全周期AI工作流，助力千行百业智能升级面向开发者的一站式AI开发平台，可快速创建和部署模型，管理全周期AI工作流，助力千行百业智能升级购买控制台文档资源与工具资源与工具开发服务

产品
概要 - CodeArts IDE Online
概要 - CodeArts IDE Online

概要本章节主要讲解如何在CodeArts IDE Online中使用TensorFlow和Jupyter Notebook完成神经网络模型的训练，并利用该模型完成简单的图像分类。父主题：基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

 帮助中心 > CodeArts IDE Online > 最佳实践 > 基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型
准备工作 - CodeArts IDE Online
准备工作 - CodeArts IDE Online

Editor，可以在里面编辑和运行cell。父主题：基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

 帮助中心 > CodeArts IDE Online > 最佳实践 > 基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

AI平台ModelArts

深度学习模型优化

《机器学习模型快速收敛的秘籍大揭秘》

深度学习-通用模型调试技巧

深度学习模型训练流程思考

使用Python实现深度学习模型：元学习与模型无关优化（MAML）

深度学习模型结构

深度学习模型结构

【开源模型学习】AlexNet深度学习模型总结

部署深度学习模型

各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

使用模型 - CodeArts IDE Online

深度学习模型编译技术

创建和训练模型 - CodeArts IDE Online

深度学习LSTM模型

AI平台ModelArts入门

基于CodeArts IDE Online、TensorFlow和Jupyter Notebook开发深度学习模型 - CodeArts IDE Online

AI平台ModelArts资源

概要 - CodeArts IDE Online

准备工作 - CodeArts IDE Online

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线