搜索_华为云

FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

参数说明如下： --width ：生成图片的宽 --height：生成图片的长 --num_inference_steps：推理步数 --dynamo: 使用图模式。如果使用该参数，则首次编译时间较长，请耐心等待。推理完成后，生成的图片image_1024x688.png保存在当前路径下，如下图所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

首先进入已创建的CCE集群控制版面中。根据图2的步骤进行操作，单击kubectl配置时，会弹出图3步骤页面。图2 配置中心根据图3，按步骤进行：判断是否安装 kubectl、下载kubectl配置文件、在机器中安装和配置kubectl。图3 kubectl访问集群配置在节点机器中，输

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

首先进入已创建的CCE集群控制版面中。根据图2的步骤进行操作，单击kubectl配置时，会弹出图3步骤页面。图2 配置中心根据图3，按步骤进行：判断是否安装 kubectl、下载kubectl配置文件、在机器中安装和配置kubectl。图3 kubectl访问集群配置在节点机器中，输

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
查看在线服务详情 - AI开发平台ModelArts

个性化配置规则的优先级与顺序相对应，从高到低设置。您可以通过拖动个性化配置规则的顺序更换优先级。当匹配了某一规则后就不再继续下一规则的判断，最多允许配置10个条件。表3 个性化配置参数参数是否必选说明配置条件必选 SPEL（Spring Expression Language）规则的表达式，当

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
训练输出路径被其他作业使用 - AI开发平台ModelArts

running job contain train_url: /bucket-20181114/code_hxm/ 原因分析根据报错信息判断，在创建训练作业时，同一个“训练输出路径”在被其他作业使用。处理方法一个“训练输出路径”只能被一个处于“运行中”、“排队中”或“初始化”状态的作业使用。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
批量添加样本 - AI开发平台ModelArts

ples 表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 final_annotation

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Standard模型训练 - AI开发平台ModelArts

时间与计算成本支持训练数据使用SFS Turbo文件系统进行数据挂载，训练作业产生的中间和结果等数据可以直接高速写入到SFS Turbo缓存中，并可被下游业务环节继续读取并处理，结果数据可以异步方式导出到关联的OBS对象存储中进行长期低成本存储，从而加速训练场景下加速OBS对象存储中的数据访问

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
Yolov8基于DevServer适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

zip软件包中。模型每次推理的图片数量必须是支持的batchsize，比如当前转换的mindir模型batchsize仅支持1，那么模型推理输入的图片数只能是1张；如果当前转换的mindir模型的batchsize支持多个，比如1，2，4，8，那么模型推理输入的图片数可以是1，2，4，8。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
精度调优总体思路 - AI开发平台ModelArts

Tools工具链下精度调试部分的工具包，主要包括精度预检、溢出检测和精度比对等功能，通过采集和对比标杆（GPU/CPU）环境和昇腾环境上运行训练时的差异点来判断问题所在。整体流程如下图所示，更多介绍请参考昇腾精度调试指南。图1 精度调优流程溢出检测和Dump比对是通过在PyTorch模型中注入

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
模型训练存储加速 - AI开发平台ModelArts

将被赋值为"/home/ma-user/modelarts/outputs/train_url_0" train_url = args.train_url # 判断输出路径中是否有模型文件。如果无文件则默认从头训练，如果有模型文件，则加载epoch值最大的ckpt文件当做预训练模型。 if os.listdir(train_url):

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查是否安装docker。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
推理精度测试 - AI开发平台ModelArts

保存未推理出结果的问题，例如超时、系统错误 │ ├── system_error.xlsx # 保存推理结果，但是可能答非所问，无法判断是否正确，需要人工判断进行纠偏。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

got an unexpected keyword argument 'resume_from_checkpoint' Huggingface缓存目录空间不足，出现OSError: [Errno 122] Disk quota exceeded 调用transformers出现ImportError:

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导
设置断点续训练 - AI开发平台ModelArts

将被赋值为"/home/ma-user/modelarts/outputs/train_url_0" train_url = args.train_url # 判断输出路径中是否有模型文件。如果无文件则默认从头训练，如果有模型文件，则加载epoch值最大的ckpt文件当做预训练模型。 if os.listdir(train_url):

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

PU镜像被其他容器挂载。请先正常安装NPU设备和驱动，或释放被挂载的NPU。检查containerd是否安装。 containerd -v # 检查containerd是否安装在创建CCE集群时，会选择 containerd 作为容器引擎，并默认给机器安装。如尚未安装，说

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
发布数据 - AI开发平台ModelArts
发布数据 - AI开发平台ModelArts

数据类型至少选择一个数据集类型的标签。可选标签：图片、音频、视频、文本、表格、其他许可证类型根据业务需求和数据集类型选择合适的许可证类型。单击许可证类型后面的可以查看许可证详情。谁可以看设置此数据集的公开权限。可选值有： “公开”：表示所有使用AI Gallery的用户都可以查看且使用该资产。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

”。图1 示例图片添加指标查询信息。图2 示例图片添加方式：选择“按指标维度添加”。指标名称：在右侧下拉框中选择“全量指标”，然后选择想要查询的指标，参考表1、表2 指标维度：填写过滤该指标的标签，请参考表4的Label名字栏。样例如下：图3 示例图片单击确定，即可出现指标信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
托管模型到AI Gallery - AI开发平台ModelArts

Gallery仓库）里面。每一个模型实例视作一个资产仓库，模型实例与资产仓库之间是一一对应的关系。例如，模型名称为“Test”，则AI Gallery仓库有个名为“Test”的仓库，其中只存放Test模型实例的全部文件。功能说明支持本地文件托管至AI Gallery仓库且支持多个文件同时上传。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
托管数据集到AI Gallery - AI开发平台ModelArts

Gallery仓库）里面。每一个数据集实例视作一个资产仓库，数据集实例与资产仓库之间是一一对应的关系。例如，模型名称为“Test”，则AI Gallery仓库有个名为“Test”的仓库，其中只存放Test模型实例的全部文件。功能说明支持本地文件托管至AI Gallery仓库且支持多个文件同时上传。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
推理精度测试 - AI开发平台ModelArts

保存未推理出结果的问题，例如超时、系统错误 │ ├── system_error.xlsx # 保存推理结果，但是可能答非所问，无法判断是否正确，需要人工判断进行纠偏。父主题：主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）

总条数： 1154

上一页
1
...
14
15
16
...
58
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

训练输出路径被其他作业使用 - AI开发平台ModelArts

批量添加样本 - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

Yolov8基于DevServer适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

精度调优总体思路 - AI开发平台ModelArts

模型训练存储加速 - AI开发平台ModelArts

SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

发布数据 - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

托管模型到AI Gallery - AI开发平台ModelArts

托管数据集到AI Gallery - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线