搜索_华为云

SDXL基于DevServer适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

SDXL基于DevServer适配PyTorch NPU的LoRA训练指导（6.3.905） Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。SDXL LoRA训练是指在已经训练好的SDXL模型基础上，使用新的数据集进行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
数据集版本发布失败 - AI开发平台ModelArts

数据集版本发布失败出现此问题时，表示数据不满足数据管理模块的要求，导致数据集发布失败，无法执行自动学习的下一步流程。请根据如下几个要求，检查您的数据，将不符合要求的数据排除后再重新启动自动学习的训练任务。 ModelArts.4710 OBS权限问题 ModelArts在跟OBS

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
管理批量服务生命周期 - AI开发平台ModelArts

管理批量服务生命周期启动服务您可以对处于“运行完成”、“异常”和“停止”状态的服务进行启动操作，“部署中”状态的服务无法启动。启动服务，当服务处于“运行中”状态后，ModelArts将开始计费。您可以通过如下方式启动服务：登录ModelArts管理控制台，在左侧菜单栏中选择“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明本文档主要介绍昇腾云服务6.3.905版本配套的镜像地址、软件包获取方式和支持的特性能力。配套的基础镜像镜像地址获取方式镜像软件说明配套关系 PyTorch：西南-贵阳一 swr.cn-southwest-2.myhuaweicloud.com

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
在ModelArts Standard上运行GPU训练任务的场景介绍 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练任务的场景介绍不同AI模型训练所需要的数据量和算力不同，在训练时选择合适的存储及训练方案可提升模型训练效率与资源性价比。ModelArts Standard支持单机单卡、单机多卡和多机多卡的训练场景，满足不同AI模型训练的要求

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
订阅免费算法 - AI开发平台ModelArts

订阅免费算法在AI Gallery中，您可以查找并订阅免费满足业务需要的算法，直接用于创建训练作业。 AI Gallery中分享的算法支持免费订阅，但在使用过程中如果消耗了硬件资源进行部署，管理控制台将根据实际使用情况收取硬件资源的费用。前提条件注册并登录华为云，且创建好OBS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
管理在线服务生命周期 - AI开发平台ModelArts

管理在线服务生命周期启动服务您可以对处于“运行完成”、“异常”和“停止”状态的服务进行启动操作，“部署中”状态的服务无法启动。启动服务，当服务处于“运行中”状态后，ModelArts将开始计费。您可以通过如下方式启动服务：登录ModelArts管理控制台，在左侧菜单栏中选择“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU）本文介绍了使用训练作业的自定义镜像+自定义启动命令来启动PyTorch DDP on Ascend加速卡训练。前提条件需要有Ascend加速卡资源池。创建训练作业本案例创建训练作业时，需要配置如下参数。表1 创建训练作业的配置说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

准备代码本教程中用到的模型软件包如下表所示，请提前准备好。获取模型软件包本方案支持的模型对应的软件和依赖包获取地址如表1所示。表1 模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6.3.907-xxx.zip 说明：软件包名称中的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
附录：训练常见问题 - AI开发平台ModelArts

附录：训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.908）本文档主要介绍如何在ModelArts Lite的DevServer环境中部署Stable Diffusion模型对应SD1.5和SDXL的Diffusers框架

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
LLaVA模型基于DevServer适配PyTorch NPU预训练指导（6.3.906） - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU预训练指导（6.3.906） LLaVA是一种新颖的端到端训练的大型多模态模型，它结合了视觉编码器和Vicuna，用于通用的视觉和语言理解，实现了令人印象深刻的聊天能力，在科学问答（Science QA）上达到了新的高度

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。SDXL Finetune是指在已经训练好的SDXL模型基础上

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
SDXL&SD1.5 ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.906） ComfyUI是一款基于节点工作流的Stable Diffusion操作界面。通过将Stable Diffusion的流程巧妙分解成各个节点，成功实现了工作流的精确定制和可靠复现

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） LLaVA是一种新颖的端到端训练的大型多模态模型，它结合了视觉编码器和Vicuna，用于通用的视觉和语言理解，实现了令人印象深刻的聊天能力，在科学问答（Science QA）上达到了新的高度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
分页查询智能任务列表 - AI开发平台ModelArts

分页查询智能任务列表功能介绍分页查询智能任务列表，包括“智能标注”和“自动分组”两大类智能任务。可通过指定“type”参数来单独查询某类任务的列表。 “智能标注”是指基于当前标注阶段的标签及图片学习训练，选中系统中已有的模型进行智能标注，快速完成剩余图片的标注操作。“智能标注”

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练前卡死 - AI开发平台ModelArts

训练前卡死作业为多节点训练，且还未开始训练时发生卡死，可以在代码中加入os.environ["NCCL_DEBUG"] = "INFO"，查看NCCL DEBUG信息。问题现象1 日志中还未出现NCCL DEBUG信息时已卡死。解决方案1 检查代码，检查是否有参数中未传入“master_ip

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业卡死
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

创建算法机器学习从有限的观测数据中学习一般性的规律，并利用这些规律对未知的数据进行预测。为了获取更准确的预测结果，用户需要选择一个合适的算法来训练模型。针对不同的场景，ModelArts提供大量的算法样例。以下章节提供了关于业务场景、算法学习方式、算法实现方式的指导。选择算法的实现方式

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
如何在Notebook中上传下载OBS文件？ - AI开发平台ModelArts

如何在Notebook中上传下载OBS文件？在Notebook中可以通过调用ModelArts的Moxing接口或者SDK接口与OBS交互，将Notebook中的文件上传至OBS，或者下载OBS中的文件至Notebook中。图1 Notebook中上传下载OBS文件使用OBS

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 文件上传下载
单模型性能调优AOE - AI开发平台ModelArts

单模型性能调优AOE 使用AOE工具可以在模型转换阶段对于模型运行和后端编译过程进行执行调优，注意AOE只适合静态shape的模型调优。在AOE调优时，容易受当前缓存的一些影响，建议分两次进行操作，以达到较好的优化效果（第一次执行生成AOE的知识库，在第二次使用时可以复用）。在该场景中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优

总条数： 427

上一页
1
...
14
15
16
...
22
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SDXL基于DevServer适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

数据集版本发布失败 - AI开发平台ModelArts

管理批量服务生命周期 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练任务的场景介绍 - AI开发平台ModelArts

订阅免费算法 - AI开发平台ModelArts

管理在线服务生命周期 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU预训练指导（6.3.906） - AI开发平台ModelArts

SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

分页查询智能任务列表 - AI开发平台ModelArts

训练前卡死 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

如何在Notebook中上传下载OBS文件？ - AI开发平台ModelArts

单模型性能调优AOE - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线