搜索_华为云

准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

准备代码软件配套版本本方案支持的软件配套版本和依赖包获取地址如表1所示。表1 软件配套版本和获取地址软件名称说明下载地址 AscendCloud-6.3.910-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的推理部署代码和推理评测代码、推

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备训练模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置物理机环境操作。镜像地址本教程中用到的训练和推理的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址基础镜像 swr.cn-southwest-2.myhuaweicloud.com/a

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 准备工作
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

训练代码中包含三部分入参，分别为训练基础参数、分布式参数和数据相关参数。其中分布式参数由平台自动入参，无需自行定义。数据相关参数中的custom_data表示是否使用自定义数据进行训练，该参数为“true”时使用基于torch自定义的随机数据进行训练和验证。 cifar10数据集在Notebo

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
续费概述 - AI开发平台ModelArts
续费概述 - AI开发平台ModelArts

ModelArts使用不受影响。专属资源池到期后的状态说明，请参见到期后影响。续费相关的功能包年/包月专属资源池续费相关的功能如表1所示。表1 续费相关的功能功能说明手动续费包年/包月专属资源池从购买到被自动删除之前，您可以随时在ModelArts控制台为专属资源池续费，以延长专属资源池的使用时间。

帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

才能执行完成，并且执行“nvidia-smi”也明显变很卡顿。原因分析根据现象描述可能出现了nvidia-smi D+进程。 "D+"表示进程状态为"Uninterruptible Sleep (usually IO)"，即进程正在等待I/O操作完成，此时无法被中断。在正常

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
训练性能测试 - AI开发平台ModelArts

<可选>任务完成输出excel表格路径，默认为"./"当前所在路径。查看性能结果任务完成之后会在test-benchmark目录下生成excel表格：性能结果 LLaMAFactory_train_performance_benchmark_<版本号>_<时间戳>.xlsx 表格样例如下：父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
SDXL&SD1.5 ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B单机单卡。表1 环境要求名称版本 driver 23.0.5 PyTorch pytorch_2.1.0 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
下载或读取文件报错，提示超时、无剩余空间 - AI开发平台ModelArts

实际存储空间足够，却依旧报错“No Space left on device”。同一目录下创建较多文件，为了加快文件检索速度，内核会创建一个索引表，短时间内创建较多文件时，会导致索引表达到上限，进而报错。触发条件和下面的因素有关：文件名越长，文件数量的上限越小 blocksize越小，文件数量的上限越小。（

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
查询支持的服务部署规格 - AI开发平台ModelArts

默认为空，代表是用户自己产生的模型；取值为auto时，代表是自动学习训练的模型，计费方式有差别。 is_free Boolean 当前规格是否是免费规格，“true”表示是免费规格。 over_quota Boolean 当前规格是否超过可用配额，“true”表示超过可用配额。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询AI应用列表 - AI开发平台ModelArts

查询AI应用列表功能介绍查询AI应用列表，可以根据不同的检索参数进行查询。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/models

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

部署AI应用登录AI Gallery。单击“模型”进入模型列表。选择需要部署为AI应用的模型，单击模型名称进入模型详情页。在模型详情页，选择“部署 > AI应用”进入创建AI应用页面。在创建AI应用页面填写相关参数。表1 创建AI应用参数是否必填说明 AI应用英文名称是

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.909版本，请参考表1获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。确保容器可以访问公网。资源规格要求推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。软件配套版本表1 获取软件分类名称获取路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

能力，和高度自动化的参数配置机制，使得模型优化过程不再依赖于手动尝试，显著缩短了从模型开发到部署的周期，确保了模型在各类应用场景下的高性能表现，让客户能够更加聚焦于业务逻辑与创新应用的设计。资源易获取，按需收费，按需扩缩，支撑故障快恢与断点续训企业在具体使用大模型接入企业应用

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.907版本，请参考表1获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。确保容器可以访问公网。资源规格要求推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。软件配套版本表1 获取软件分类名称获取路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
订阅Workflow - AI开发平台ModelArts

y > 我的资产 > Workflow”，进入“我的Workflow”页面。单击“我的订阅”，进入个人订阅的Workflow列表。在“我的订阅”列表，选择需要导入的Workflow，单击“应用控制台”旁的“Workflow”。图2 选择应用控制台在弹出来的对话框中选择、填

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

输入数据：编译后的模型提供了predict接口用户执行模型推理任务，Inputs输入为List Tensor，这里的Tensor是MSLite的概念，具体的列表长度和tensor类型由转换时的InputShape来确定，由于后端指定了ascend，这些tensor都是在昇腾设备的显存中，用户需要在对

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
发布ModelArts模型 - AI开发平台ModelArts

I Gallery”，进行知识共享。登录ModelArts管理控制台，在左侧导航栏中选择“模型管理”，进入模型列表页面。单击模型的“版本数量”，在展开的版本列表中，单击“操作”列的“发布”进入发布页面。在发布弹出框中，单击“前往AI Gallery”进入AI Gallery。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
ModelArts入门实践 - AI开发平台ModelArts

ModelArts入门实践本章节列举了一些常用的实践案例，方便您快速了解并使用ModelArts完成AI开发。表1 常用最佳实践分类实践案例描述适用人群 ModelArts Studio 在ModelArts Studio基于Llama3-8B模型实现新闻自动分类本案例介绍在ModelArts

帮助中心 > AI开发平台ModelArts > 快速入门
计算规格说明 - AI开发平台ModelArts

Gallery提供了多种计算规格供用户按需选用。只要用户的账号费用充足，就可以持续使用资源，详细计费说明请参见计费说明。计费说明 AI Gallery的计费规则如表1所示。表1 计费说明规则说明话单上报规则仅当AI Gallery工具链服务创建成功且实际开始运行时，才会上报话单并开始计费，其他状态不

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
查询服务列表 - AI开发平台ModelArts

查询服务列表功能介绍查询模型服务列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/services 表1 路径参数

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理

总条数： 1100

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备代码 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

续费概述 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

下载或读取文件报错，提示超时、无剩余空间 - AI开发平台ModelArts

查询支持的服务部署规格 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

订阅Workflow - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

发布ModelArts模型 - AI开发平台ModelArts

ModelArts入门实践 - AI开发平台ModelArts

计算规格说明 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线