搜索_华为云

各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

各个模型深度学习训练加速框架的选择 LlamaFactory框架使用两种训练框架： DeepSpeed和Accelerate都是针对深度学习训练加速的工具，但是它们的实现方式和应用场景有所不同。 DeepSpeed是一种深度学习加速框架，主要针对大规模模型和大规模数据集的训练。D

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
超过最大递归深度导致训练作业失败 - AI开发平台ModelArts

超过最大递归深度导致训练作业失败问题现象 ModelArts训练作业报错： RuntimeError: maximum recursion depth exceeded in __instancecheck__ 原因分析递归深度超过了Python默认的递归深度，导致训练失败。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？场景描述在使用ModelArts进行自定义深度学习训练时，训练数据通常存储在对象存储服务（OBS）中，且训练数据较大时（如200GB以上），每次都需要使用GPU资源池进行训练，且训练效率低。希望提升训练效率，同时减

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

800训练服务器三维视图 Atlas 800 训练服务器（型号9000）是基于华为鲲鹏920+Snt9处理器的AI训练服务器，实现完全自主可控，广泛应用于深度学习模型开发和AI训练服务场景，可单击此处查看硬件三维视图。 Atlas 800训练服务器HCCN Tool Atlas 800 训练服务器 1.0

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

器翻译和对话系统等。 DeepSpeed是开源的加速深度学习训练的库。它针对大规模的模型和分布式训练进行了优化，可以显著提高训练速度和效率。DeepSpeed提供了各种技术和优化策略，包括分布式梯度下降、模型并行化、梯度累积和动态精度缩放等。它还支持优化大模型的内存使用和计算资源分配。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
Standard自动学习 - AI开发平台ModelArts

模型架构自动设计（神经网络搜索和自适应模型调优），和更快、更准的训练参数自动调优自动训练采用自动机器学习技术，基于信息熵上限近似模型的树搜索最优特征变换和基于信息熵上限近似模型的贝叶斯优化自动调参，从企业关系型（结构化）数据中，自动学习数据特征和规律，智能寻优特征&ML模型及参数，准确性甚至达到专家开发者的调优水平

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
在ModelArts训练得到的模型欠拟合怎么办？ - AI开发平台ModelArts

在ModelArts训练得到的模型欠拟合怎么办？模型复杂化。对同一个算法复杂化。例如回归模型添加更多的高次项，增加决策树的深度，增加神经网络的隐藏层数和隐藏单元数等。弃用原来的算法，使用一个更加复杂的算法或模型。例如用神经网络来替代线性回归，用随机森林来代替决策树。增加更多的特征，使输入数据具有更强的表达能力。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
Standard模型训练 - AI开发平台ModelArts

Standard模型训练提供容器化服务和计算资源管理能力，负责建立和管理机器学习训练工作负载所需的基础设施，减轻用户的负担，为用户提供灵活、稳定、易用和极致性能的深度学习训练环境。通过ModelArts Standard模型训练，用户可以专注于开发、训练和微调模型。 ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
分页查询智能任务列表 - AI开发平台ModelArts

内置属性：图像尺寸（图像的宽度、高度、深度），类型为List[/topic/body/section/table/tgroup/tbody/row/entry/p/br {""}) (br]。列表中的第一个数字为宽度(像素)，第二个数字为高度(像素)，第三个数字为深度(深度可以没有，默认为3)，如[100

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
ModelArts中常用概念 - AI开发平台ModelArts

开发、训练和部署。支持公共资源池和专属资源池两种，分别为共享资源池和独享资源池。 ModelArts Standard默认提供公共资源池。ModelArts Standard专属资源池需单独创建，专属使用，不与其他用户共享。 ModelArts Lite Server和ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
AI开发基本流程介绍 - AI开发平台ModelArts

分数据源，反复调整优化。训练模型俗称“建模”，指通过分析手段、方法和技巧对准备好的数据进行探索分析，从中发现因果关系、内部联系和业务规律，为商业目的提供决策参考。训练模型的结果通常是一个或多个机器学习或深度学习模型，模型可以应用到新的数据中，得到预测、评价等结果。业界主流的

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
模型训练使用流程 - AI开发平台ModelArts

增量训练分布式训练训练加速训练高可靠性查看训练结果和日志查看训练作业详情训练作业运行中或运行结束后，可以在训练作业详情页面查看训练作业的参数设置，训练作业事件等。查看训练作业日志训练日志用于记录训练作业运行过程和异常信息，可以通过查看训练作业日志定位作业运行中出现的问题。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
Standard模型部署 - AI开发平台ModelArts

、云的各种设备上和各种场景上，并且还为个人开发者、企业和设备生产厂商提供了一整套安全可靠的一站式部署方式。图1 部署模型的流程在线推理服务，可以实现高并发，低延时，弹性伸缩，并且支持多模型灰度发布、A/B测试。支持各种部署场景，既能部署为云端的在线推理服务和批量推理任务，也能部署到端，边等各种设备。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

的数量。权重矩阵被分解为经过训练和更新的低秩矩阵。所有预训练的模型参数保持冻结。训练后，低秩矩阵被添加回原始权重。这使得存储和训练LoRA模型更加高效，因为参数明显减少。超参数设置，基于训练作业配置超参。超参指的是模型训练时原始数据集中实际字段和算法需要字段之间的映射关系。当

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

件方法一：在Notebook中通过Moxing上传下载OBS文件 MoXing是ModelArts自研的分布式训练加速框架，构建于开源的深度学习引擎TensorFlow、PyTorch等之上，使用MoXing API可让模型代码的编写更加简单、高效。 MoXing提供了一套文件对象API，可以用来读写OBS文件。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
准备模型训练镜像 - AI开发平台ModelArts

准备模型训练镜像 ModelArts平台提供了Tensorflow，PyTorch，MindSpore等常用深度学习任务的基础镜像，镜像里已经安装好运行任务所需软件。当基础镜像里的软件无法满足您的程序运行需求时，您还可以基于这些基础镜像制作一个新的镜像并进行训练。训练作业的预置框架介绍

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
获取智能任务的信息 - AI开发平台ModelArts

内置属性：图像尺寸（图像的宽度、高度、深度），类型为List[/topic/body/section/table/tgroup/tbody/row/entry/p/br {""}) (br]。列表中的第一个数字为宽度(像素)，第二个数字为高度(像素)，第三个数字为深度(深度可以没有，默认为3)，如[100

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练专属预置镜像列表 - AI开发平台ModelArts

训练专属预置镜像列表 ModelArts平台提供了Tensorflow，PyTorch，MindSpore等常用深度学习任务的基础镜像，镜像里已经安装好运行任务所需软件。当基础镜像里的软件无法满足您的程序运行需求时，您可以基于这些基础镜像制作一个新的镜像并进行训练。训练基础镜像列表

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
启动智能任务 - AI开发平台ModelArts

内置属性：图像尺寸（图像的宽度、高度、深度），类型为List[/topic/body/section/table/tgroup/tbody/row/entry/p/br {""}) (br]。列表中的第一个数字为宽度(像素)，第二个数字为高度(像素)，第三个数字为深度(深度可以没有，默认为3)，如[100

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
套餐包 - AI开发平台ModelArts
套餐包 - AI开发平台ModelArts

ModelArts提供了AI全流程开发的套餐包，面向有AI基础的开发者，提供机器学习和深度学习的算法开发及部署全功能，包含数据处理、模型开发、模型训练、模型管理和模型部署流程。约束限制套餐包在购买和使用时的限制如下：套餐包和购买时选定的区域绑定，套餐包只能使用于购买时选定的区域，且只能用于公

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式

总条数： 852

上一页
1
2
3
4
5
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

超过最大递归深度导致训练作业失败 - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

Standard自动学习 - AI开发平台ModelArts

在ModelArts训练得到的模型欠拟合怎么办？ - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

分页查询智能任务列表 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

AI开发基本流程介绍 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

准备模型训练镜像 - AI开发平台ModelArts

获取智能任务的信息 - AI开发平台ModelArts

训练专属预置镜像列表 - AI开发平台ModelArts

启动智能任务 - AI开发平台ModelArts

套餐包 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线