搜索_华为云

SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.912） Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。方案概览本方案介绍了在ModelArts Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
Finetune训练 - AI开发平台ModelArts

所有数据保存在auto_log/avg_step_time.txt文本中 auto_log/log/目录下存放各个shapes的数据父主题： SD1.5&SDXL Kohya框架基于DevServer适配PyTorch NPU训练指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Kohya框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
自定义镜像训练作业配置节点间SSH免密互信 - AI开发平台ModelArts

当用户使用基于MPI和Horovod框架的自定义镜像进行分布式训练时，需配置训练作业节点间SSH免密互信，否则训练会失败。配置节点间SSH免密互信涉及代码适配和训练作业参数配置，本文提供了一个操作示例。准备一个预装OpenSSH的自定义镜像，使用的训练框架是MPI或Horovod。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

获取某个超参敏感度分析图像的保存路径。提前终止自动化搜索作业的某个trial 提前终止自动化搜索作业的某个trial。获取自动化搜索作业yaml模板的信息获取自动化搜索作业yaml模板的信息。获取自动化搜索作业yaml模板的内容获取自动化搜索作业yaml模板的内容。表8 训练作业标签管理接口

 帮助中心 > AI开发平台ModelArts > API参考
使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

代码中涉及到的OBS路径，请用户替换为自己的实际OBS路径。代码是以PyTorch为例编写的，不同的AI框架之间，整体流程是完全相同的，仅需修改7和11中的 framework_type参数值即可，例如：MindSpore框架，此处framework_type=Ascend-Powered-Engine。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
准备镜像环境 - AI开发平台ModelArts

续命令。 docker exec -it ${container_name} bash 父主题： SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）
Finetune训练 - AI开发平台ModelArts

--checkpointing_steps=5000 训练执行成功如下图所示。图1 训练执行成功父主题： SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）
ModelArts最佳实践案例列表 - AI开发平台ModelArts

署为在线服务的免费体验过程。第三方推理框架迁移到ModelArts Standard推理自定义引擎第三方框架推理部署 - ModelArts支持第三方的推理框架在ModelArts上部署，本文以TFServing框架、Triton框架为例，介绍如何迁移到推理自定义引擎。第三方案例列表

 帮助中心 > AI开发平台ModelArts > 最佳实践
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

diffusers_sdxl_lora_train.sh 训练执行成功如下图所示。图1 训练执行成功父主题： SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）
创建自动模型优化的训练作业 - AI开发平台ModelArts

可选“最大化”或者“最小化”。指标正则填入正则表达式。您可以单击智能生成功能自动获取正则表达式。设置自动化搜索参数从已设置的“超参”中选择可用于搜索优化的超参。优化的超参仅支持float类型，选中自动化搜索参数后，需设置取值范围。搜索算法配置 ModelArts内置三种超参搜索算法，用户

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 自动模型优化（AutoSearch）
msprobe API预检 - AI开发平台ModelArts

sult_{timestamp}.csv属于API级，标明每个API是否通过测试。建议用户先查看accuracy_checking_result_{timestamp}.csv文件，对于其中没有通过测试的或者特定感兴趣的API，根据其API name字段在 accuracy_ch

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
训练场景和方案介绍 - AI开发平台ModelArts

从SWR拉取不同软件版本对应的基础镜像地址不同，请严格按照软件版本和镜像配套关系获取基础镜像。父主题： SD1.5&SDXL Kohya框架基于DevServer适配PyTorch NPU训练指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Kohya框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

volcano job形式下发lite池集群。训练测试用例使用NLP的bert模型，详细代码和指导可参考Bert。图1 任务示意图操作步骤拉取镜像。本测试镜像为bert_pretrain_mindspore:v1，已经把测试数据和代码打进镜像中。 docker pull swr

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
MaaS使用场景和使用流程 - AI开发平台ModelArts

降低企业AI落地的成本与难度。当您第一次使用MaaS服务时，可以参考快速入门使用ModelArts Studio的Qwen2-7B模型框架实现对话问答，了解如何在MaaS服务上的创建和部署模型。当您想更全面的了解MaaS服务的功能时，也可以参考最佳实践在ModelArts S

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

开发用于自定义镜像训练的代码当ModelArts Standard提供的预置框架不满足您的诉求时，ModelArts Standard支持用户构建自定义镜像用于模型训练。自定义镜像的制作要求用户对容器相关知识有比较深刻的了解，除非订阅算法和预置框架无法满足需求，否则不推荐使用。自定义镜像需上传至容器镜

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

txt”文件安装依赖包。使用预置框架创建训练作业请参考开发用于预置框架训练的代码指导。使用预置框架 + 自定义镜像：如果先前基于预置框架且通过指定代码目录和启动文件的方式来创建的算法；但是随着业务逻辑的逐渐复杂，您期望可以基于预置框架修改或增加一些软件依赖的时候，此时您可以使用预置框架 + 自定义

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
工具介绍及准备工作 - AI开发平台ModelArts

最优性能的配置。目前仅支持SFT指令监督微调训练阶段。准备工作参考benchmark-准备工作，开始训练测试，具体步骤参考训练性能测试或训练精度测试，根据实际情况决定。父主题：训练benchmark工具

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 训练benchmark工具
训练场景和方案介绍 - AI开发平台ModelArts

从SWR拉取不同软件版本对应的基础镜像地址不同，请严格按照软件版本和镜像配套关系获取基础镜像。父主题： SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）
使用SDK调测单机训练作业 - AI开发平台ModelArts

代码中涉及到的OBS路径，请用户替换为自己的实际OBS路径。代码是以PyTorch为例编写的，不同的AI框架之间，整体流程是完全相同的，仅需修改6和10中的framework_type参数值即可，例如：MindSpore框架，此处framework_type=Ascend-Powered-Engine。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制推理部署使用的服务框架是vLLM（官网地址：https://github

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）

总条数： 714

上一页
1
...
5
6
7
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SD3 Diffusers框架基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

自定义镜像训练作业配置节点间SSH免密互信 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

LoRA训练 - AI开发平台ModelArts

创建自动模型优化的训练作业 - AI开发平台ModelArts

msprobe API预检 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

开发用于自定义镜像训练的代码 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

使用SDK调测单机训练作业 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线