搜索_华为云

Hunyuan-DiT基于Lite Server部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

sysctl -p | grep net.ipv4.ip_forward 步骤二：启动镜像启动容器镜像，推理只需要启动单卡，启动前可以根据实际需要增加修改参数。 export work_dir="自定义挂载的工作目录" export container_work_dir="自定义挂载到容器内的工作目录"

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

ror_code 昇腾系列AI处理器错误码。 - - NA NA NA AI处理器健康状态 ma_node_npu_ai_core_health_status 昇腾系列AI处理器健康状态。 - 1：健康 0：不健康连续2周期值为0 紧急建议参考故障列表，或者提工单咨询。 AI处理器功耗

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
训练启动脚本说明和参数配置【旧】 - AI开发平台ModelArts

表示context并行，默认为1。应用于训练长序列文本的模型。如果训练时SEQ_LEN超过32768长度，则推荐增加CP值（CP ≥ 2）。对应训练参数 context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示context并行，默认为1。应用于训练长序列文本的模型。如果训练时SEQ_LEN超过32768长度，则推荐增加CP值（CP ≥ 2）。对应训练参数 context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
配置Lite Server存储 - AI开发平台ModelArts

S Turbo文件系统。SFS Turbo提供按需扩展的高性能文件存储，还具备高可靠和高可用的特点，支持根据业务需要弹性扩容，且性能随容量增加而提升，可广泛应用于多种业务场景。在SFS服务控制台上创建文件系统，具体步骤请参考创建SFS Turbo文件系统。同一区域不同可用区之间文件系统与云服务器互通，因此保证SFS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示context并行，默认为1。应用于训练长序列文本的模型。若训练时SEQ_LEN超过32768长度，则推荐增加CP值（CP ≥ 2）。对应训练参数 context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练参数配置说明【旧】 - AI开发平台ModelArts

表示context并行，默认为1。应用于训练长序列文本的模型。如果训练时SEQ_LEN超过32768长度，则推荐增加CP值（CP ≥ 2）。对应训练参数 context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
训练参数配置说明【旧】 - AI开发平台ModelArts

表示context并行，默认为1。应用于训练长序列文本的模型。如果训练时SEQ_LEN超过32768长度，则推荐增加CP值（CP ≥ 2）。对应训练参数 context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

注意：推理应用开发时，需要使用模型的Resize功能，改变输入的shape。而且Resize操作需要在数据从host端复制到device端之前执行，下面是一个简单的示例，展示如何在推理应用时使用动态Shape。 import mindspore_lite as mslite import numpy as np from

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

例如，您在9:00:00购买了一个按需计费的专属资源池，规格为modelarts.vm.cpu.8ud（8vCPUs 16GiB），计算节点个数为2个，并在9:30:00升配增加2个节点（升配后共4个节点），那么在9:00:00 ~ 10:00:00间会产生两条计费信息。第一条对应9:00:00 ~ 9:30:00，按照2个计算节点个数计费。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
分布式训练功能介绍 - AI开发平台ModelArts

cifar10数据集上的分类任务，给出了分布式训练改造(DDP)的完整代码示例，供用户学习参考。基于开发环境使用SDK调测训练作业：介绍如何在ModelArts的开发环境中，使用SDK调测单机和多机分布式训练作业。父主题：分布式模型训练

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
LLaMA-VID基于Lite Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

ge_url}获取请参见表1。 docker pull {image_url} 步骤三启动容器镜像启动容器镜像，启动前可以根据实际需要增加修改参数。 docker run -itd --net=host \ --device=/dev/davinci0 \ --device=/dev/davinci1

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
Paraformer基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

ge_url}获取请参见表1。 docker pull {image_url} 步骤三：启动容器镜像启动容器镜像，启动前可以根据实际需要增加修改参数。 docker run -itd \ --device=/dev/davinci0 \ --device=/dev/davinci1

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
准备镜像环境 - AI开发平台ModelArts

# docker login 替换为： nerdctl login 步骤五修改并上传镜像 1. 在机器中输入Step4登录指令后，使用下列示例命令将镜像上传至SWR： nerdctl --namespace k8s.io tag ${dockerfile_image_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

式。本次迁移使用的是静态shape方式进行模型转换。获取模型shape 由于在后续模型转换时需要知道待转换模型的shape信息，此处指导如何通过训练好的stable diffusion PyTorch模型获取模型shape，主要有如下两种方式获取：方式一：通过stable d

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

请求Body参数参数是否必选参数类型描述 workspace_id 否 String 服务所属的工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 schedule 否 Array of Schedule objects

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询数据集导入任务的详情 - AI开发平台ModelArts

Boolean 文件中首行是否是列名，用于表格数据集。可选值如下： true：文件首行为列名 false：文件首行不为列名表4 SchemaMap 参数参数类型描述 dest_name String 目的方的列名。 src_name String 来源方的列名。表5 SourceInfo

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
FLUX.1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） - AI开发平台ModelArts

conf sysctl -p | grep net.ipv4.ip_forward 步骤二：启动镜像启动容器镜像。启动前可以根据实际需要增加修改参数，Lora微调启动单卡，Fnetune全参启动八卡。 export work_dir="自定义挂载的工作目录" export co

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
查询数据集导入任务列表 - AI开发平台ModelArts

Boolean 文件中首行是否是列名，用于表格数据集。可选值如下： true：文件首行为列名 false：文件首行不为列名表6 SchemaMap 参数参数类型描述 dest_name String 目的方的列名。 src_name String 来源方的列名。表7 SourceInfo

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

参数确认无误后，单击“提交”，完成Notebook的创建操作。进入Notebook列表，正在创建中的Notebook状态为“创建中”，创建过程需要几分钟，请耐心等待。当Notebook状态变为“运行中”时，表示Notebook已创建并启动完成。在Notebook列表，单击实例名称，进入实例详情页，查看Notebook实例配置信息。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业

总条数： 1055

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hunyuan-DiT基于Lite Server部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

训练启动脚本说明和参数配置【旧】 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练参数配置说明【旧】 - AI开发平台ModelArts

训练参数配置说明【旧】 - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

LLaMA-VID基于Lite Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

Paraformer基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

查询数据集导入任务的详情 - AI开发平台ModelArts

FLUX.1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） - AI开发平台ModelArts

查询数据集导入任务列表 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线