搜索_华为云

场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.909版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts Lite Cluster。本文档中的CCE集群版本选择v1.27~1.28。版本使用的容器引擎为Containerd。镜像适配的Cann版本是cann_8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

软件配套版本表1 获取软件分类名称获取路径插件代码包 AscendCloud-6.3.909软件包中的AscendCloud-AIGC-6.3.909-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E 说明：如果上述软

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？问题现象在高性能8卡GPU的裸金属上的训练任务突然变慢，以前1个epoch约2小时执行完成，最近1个epoch需要2天才能执行完成，并且执行“nvidia-smi”也明显变很卡顿。原因分析根据现象描述可能出现了nvidia-smi

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备Notebook 本案例在Notebook上部署推理服务进行调试，因此需要创建Notebook。部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。若需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
资源选择推荐 - AI开发平台ModelArts

点创建训练任务开始到变成运行中的时间（资源充足、镜像已缓存）。 20秒训练列表页打开已有50条训练作业，单击训练模块后的时间。 6秒日志加载作业运行中，已经输出1兆的日志文本，单击训练详情页面需要多久加载出日志。 2.5秒训练详情页作业运行中，没有用户日志情况下，在ModelArt

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

华为方技术支持下载获取。模型软件包结构说明 AscendCloud-6.3.909代码包中AscendCloud-LLM代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中： |──llm_train # 模型训练代码包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
运行第一条Workflow - AI开发平台ModelArts

订阅消息使用消息通知服务，在事件列表中选择需要监控的节点或者Workflow状态，在事件发生时发送消息通知。说明：打开开关后，需要先指定SMN主题名，如未创建主题名，需前往消息通知服务创建主题。支持对Workflow中单个节点、多个节点以及工作流的相关事件进行订阅。订阅列表中，一行代表一

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

需的模型文件、训练数据等，再将OBS中的数据文件导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格。本案例仅支持在专属资源池上运行。支持的模型列表本方案支持以下模型的训练，如表1所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
数据处理场景介绍 - AI开发平台ModelArts

数据选择：数据选择一般是指从全量数据中选择数据子集的过程。数据可以通过相似度或者深度学习算法进行选择。数据选择可以避免人工采集图片过程中引入的重复图片、相似图片等问题；在一批输入旧模型的推理数据中，通过内置规则的数据选择可以进一步提升旧模型精度。数据增强：数据扩增通过简单的数据扩增例如缩放、裁剪、变换

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.907） - AI开发平台ModelArts

naruto-blip-captions 在该目录下执行命令构建自定义镜像： docker build -t sdxl-train:0.0.1 . 在SWR服务页面创建镜像组织。图2 创建镜像组织在SWR中单击右上角的“登录指令”，然后在跳出的登录指定窗口，单击复制临时登录指令。在创建的ECS中复制临时登录指令，即可完成登录。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

environment”，请到在线服务详情界面，“调用指南”页签中获取正确的API接口地址。如果您在配置文件url中有定义路径，需要在API调用body体中调用路径后拼接自定义路径，例如：您定义url为“/predictions/poetry”，那么在API调用时路径为“{API接口地址}/predictions/poetry”。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
使用JupyterLab在线开发和调试代码 - AI开发平台ModelArts

例，请以实际控制台为准。准备训练数据和代码文件，上传到JupyterLab中。具体参见上传本地文件至JupyterLab。图4 文件上传按钮在左侧导航双击打开上传的代码文件，在JupyterLab中编写代码文件，并运行调试。有关JupyterLab的使用具体参见JupyterLab常用功能介绍。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
MaaS使用场景和使用流程 - AI开发平台ModelArts

署到计算资源上，便于在“模型体验”或其他业务环境中可以调用该模型。使用MaaS部署模型服务 5 模型体验在ModelArts Studio大模型即服务平台完成模型部署后，可以“模型体验”调用该模型服务进行功能体验。在MaaS体验模型服务调用模型服务在ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
InternVL2基于DevServer适配PyTorch NPU训练微调指导（6.3.908） - AI开发平台ModelArts

表1 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.908软件包中的AscendCloud-AIGC-6.3.908-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E 说明：如果上述软

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

表1 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.909软件包中的AscendCloud-AIGC-6.3.909-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E 说明：如果上述软

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
pipeline应用准备 - AI开发平台ModelArts

accelerate onnxruntime diffusers==0.11.1 下载git lfs，用于下载git仓中的大文件。由于欧拉源上没有git-lfs包，所以需要从压缩包中解压使用，在浏览器中输入如下地址下载git-lfs压缩包并上传到服务器的/home目录。 https://github

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
SDXL ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.904） - AI开发平台ModelArts

${work_dir}:${container_work_dir}：代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
管理Lite Cluster节点 - AI开发平台ModelArts

行。您可在资源池详情页的节点页签下，找到对应节点，在操作列单击“更多 > 授权”，在弹出的提示框中单击“确认”即可完成授权。图4 授权正常情况下，该授权按钮为置灰状态。当华为云技术支持发起运维申请后，按钮会变为可点状态。在完成运维操作后，华为云技术支持会主动关闭已获得授权，无需您额外操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
一般性问题 - AI开发平台ModelArts

ModelArts AI识别可以单独针对一个标签识别吗？ ModelArts如何通过标签实现资源分组管理为什么资源充足还是在排队？规格中数字分别代表什么含义？如何删除预置镜像中不需要的工具

 帮助中心 > AI开发平台ModelArts > 常见问题
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、创建训练任务及性能查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）

总条数： 1459

上一页
1
...
65
66
67
...
73
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景介绍 - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

运行第一条Workflow - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

数据处理场景介绍 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.907） - AI开发平台ModelArts

服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

使用JupyterLab在线开发和调试代码 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

InternVL2基于DevServer适配PyTorch NPU训练微调指导（6.3.908） - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

pipeline应用准备 - AI开发平台ModelArts

SDXL ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.904） - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

一般性问题 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线