搜索_华为云

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

2-py_3.7-ubuntu_18.04-x86_64）。 “资源池”：选择公共资源池或专属资源池，此处以公共资源池为例。 “类型”：推荐选择GPU。 “规格”：推荐选择GP Tnt004规格，如果没有再选择其他规格。参数填写完成后，单击“立即创建”进行规格确认。参数确认无误后，单击“提交”，完成Notebook的创建操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
创建诊断任务 - AI开发平台ModelArts

默认进行计算、通信、下发和内存的全维度分析。可以指定默认值中任意单维度进行分析，如仅指定computation进行计算维度分析，仅指定schedule进行下发维度分析。推荐不填写该参数，即使用默认值进行分析。 4 advisor_analyze_processes 1 否 advisor分析进程数，可选范围为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
训练作业容错检查 - AI开发平台ModelArts

新下发的训练作业会以第一优先级进行排队。如果排队时间超过30分钟，训练作业会自动退出。该现象表明资源池规格任务紧张，训练作业无法正常启动，推荐您购买专属资源池补充计算节点。如果您使用专属资源池创建训练作业，容错检查识别的故障节点会被剔除。系统自动补充健康的计算节点至专属资源池。（该功能即将上线）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
线下容器镜像构建及调试 - AI开发平台ModelArts

ckerhub官网查找即可。构建流程：安装所需的apt包、驱动，配置ma-user用户、导入conda环境、配置Notebook依赖。推荐使用Dockerfile的方式构建镜像。这样既满足dockerfile可追溯及构建归档的需求，也保证镜像内容无冗余和残留。每层构建的时候

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.5.901） - AI开发平台ModelArts

5b全量微调的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买Server资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region上的Server资源和Ascend Snt9B单机。表1 环境要求名称版本 driver 23.0.6

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
Lite Cluster使用流程 - AI开发平台ModelArts

ctl工具或k8s API来下发作业。此外，ModelArts还提供了扩缩容、驱动升级等功能，方便您对集群资源进行管理。图2 使用流程推荐您根据以下使用流程对Lite Cluster进行使用。资源开通：您需要开通资源后才可使用Lite Cluster，在开通资源前，请确保完

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
SDXL基于Lite Server适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

本文档主要介绍如何利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，完成SDXL Finetune训练。资源规格要求推荐使用“西南-贵阳一”Region上的Lite Server资源和Ascend Snt9B。表1 环境要求名称版本 CANN cann_8

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
开发用于预置框架训练的代码 - AI开发平台ModelArts

果至OBS服务指定路径，输入和输出数据需要配置2个地方：训练代码中需解析输入路径参数和输出路径参数。ModelArts Standard推荐以下方式实现参数解析。 1 2 3 4 5 6 7 8 9 10 import argparse # 创建解析 parser

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
使用AWQ量化 - AI开发平台ModelArts

28和-1，W8A16支持-1。 --w-bit：量化比特数，W4A16设置4，W8A16设置8。 --calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

28和-1，W8A16支持-1。 --w-bit：量化比特数，W4A16设置4，W8A16设置8。 --calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

images（1GB）、Train/Val annotations（241MB），分别解压后并放入coco文件夹中。下载完成后，将数据上传至SFS相应目录中。由于数据集过大，推荐先通过obsutil工具将数据集传到OBS桶后，再将数据集迁移至SFS。在本机机器上运行，通过obsutil工具将本地数据集传到OBS桶。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
上传算法至SFS - AI开发平台ModelArts

$IMAGE_DATA_PATH --cfg ./configs/swin/swin_base_patch4_window7_224_22k.yaml 推荐先使用单机单卡运行脚本，待正常运行后再改用多机多卡运行脚本。多机多卡run.sh中的“VC_WORKER_HOSTS”、“VC_WORK

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

先联系您所在企业的华为方技术支持购买Cluster资源。本方案目前仅适用于企业客户，并且需要用户具备k8s集群相关技能。资源规格要求推荐使用“西南-贵阳一”Region上的Cluster资源表1 环境要求名称版本 CANN cann_8.0.rc2 PyTorch pytorch_2

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

模型准备 MindSpore Lite提供的模型convertor工具可以支持主流的模型格式到MindIR的格式转换，用户需要导出对应的模型文件，推荐导出为ONNX格式。如何导出ONNX模型 PyTorch转ONNX，操作指导请见此处。 PyTorch导出ONNX模型样例如下： import

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
使用AWQ量化 - AI开发平台ModelArts

28和-1，W8A16支持-1。 --w-bit：量化比特数，W4A16设置4，W8A16设置8。 --calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
模型配置文件编写说明 - AI开发平台ModelArts

如果对版本有明确要求，优先使用“EXACT”；如果使用“EXACT”与系统安装包有冲突，可以选择“ATLEAST” 如果对版本没有明确要求，推荐不填写“restraint”、“package_version”，只保留“package_name”参数表8 health数据结构说明参数

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

考创建资源池。资源规格要求：硬盘空间：至少200GB。昇腾资源规格：Ascend: 8*ascend-snt9b表示昇腾8卡规格。推荐使用“西南-贵阳一”Region上的昇腾资源。 Step2 创建OBS桶 ModelArts使用对象存储服务（Object Storage

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

考创建资源池。资源规格要求：硬盘空间：至少200GB。昇腾资源规格：Ascend: 8*ascend-snt9b表示昇腾8卡规格。推荐使用“西南-贵阳一”Region上的昇腾资源。 Step2 创建OBS桶 ModelArts使用对象存储服务（Object Storage

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
FlUX.1基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.912版本，请参考表1获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。确保容器可以访问公网。资源规格要求推荐使用“西南-贵阳一”Region上的Server资源和Ascend Snt9B。软件配套版本表1 获取软件分类名称获取路径插件代码包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

5b全量微调的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买Server资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region上的Server资源和Ascend Snt9B单机。表1 环境要求名称版本 driver 23.0.6

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理

总条数： 630

上一页
1
...
27
28
29
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

创建诊断任务 - AI开发平台ModelArts

训练作业容错检查 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.5.901） - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

SDXL基于Lite Server适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

开发用于预置框架训练的代码 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

模型配置文件编写说明 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

FlUX.1基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线