搜索_华为云

准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。通过容器名称进入容器中。启动容器时默认用户为ma-user用户。 docker exec -it ${container_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

服务的“OBS Administrator”已生效。创建ModelArts自定义策略如果系统预置的ModelArts权限不满足您的授权要求，或者您需要管理用户操作OBS的操作权限，可以创建自定义策略。更多关于创建自定义策略操作和参数说明请参见创建自定义策略。目前华为云支持可

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。通过容器名称进入容器中。启动容器时默认用户为ma-user用户。 docker exec -it ${container_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8.0.rc3。 Lite Server驱动版本要求23.0.6 PyTorch版本：2.1.0 确保容器可以访问公网。文档更新内容 6.3.910版本相对于6.3.909版本新增如下内容：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910）
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

认证”，进入统一身份认证（IAM）服务。在统一身份认证服务页面的左侧导航选择“权限管理 > 权限”，单击右上角的“创建自定义策略”按如下要求设置完成后单击“确定”。 “策略名称”：设置自定义策略名称，例如：允许通过Cloud Shell访问运行中的训练作业。 “策略配置方式”：选择可视化视图。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

服务的“OBS Administrator”已生效。创建ModelArts自定义策略如果系统预置的ModelArts权限不满足您的授权要求，或者您需要管理用户操作OBS的操作权限，可以创建自定义策略。更多关于创建自定义策略操作和参数说明请参见创建自定义策略。目前华为云支持可

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > FAQ
在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

要常驻的服务，建议关掉该按钮。描述：按照需要填写。资源池：选择专属资源池。若之前未购买专属资源池，具体步骤请参考创建资源池。资源规格要求：硬盘空间：至少200GB。昇腾资源规格：可以申请Ascend: 1* ascend-snt9b(32GB)或Ascend: 1* a

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

推理代码包 |──llm_tools # 推理工具工作目录介绍详细的工作目录参考如下，建议参考以下要求设置工作目录。训练脚本以分类的方式集中在 scripts 文件夹中。 ${workdir}（例如/home/ma-user/ws ） |──llm_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。通过容器名称进入容器中。启动容器时默认用户为ma-user用户。 docker exec -it ${container_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
在推理生产环境中部署推理服务 - AI开发平台ModelArts

配置后重启推理服务生效。 Matmul_all_reduce融合算子使用Matmul_all_reduce融合算子能提升全量推理性能，该算子对驱动和固件版本要求较高，默认不开启。如需开启，配置以下环境变量。 export USE_MM_ALL_REDUCE_OP=1 关闭Matmul_all_reduce融合算子的命令：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

单击从容器镜像中导入模型的镜像，其中，模型均为Image类型，且不再需要用配置文件中的“swr_location”来指定您的镜像位置。制作自定义镜像的操作指导及规范要求，请参见模型镜像规范。说明：您选择的模型镜像将共享给系统管理员，请确保具备共享该镜像的权限（不支持导入其他账户共享给您的镜像），部署上

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
将模型部署为批量推理服务 - AI开发平台ModelArts

式。输入数据格式为csv时，建议文件大小不超过12MB。如果单张图片/csv文件超过文件12MB，会提示报错，建议调整文件大小使其符合要求，或联系技术支持人员调整文件大小限制。 “请求路径” 批量服务中调用模型的接口URL，表示服务的请求路径，此值来自模型配置文件中apis的url字段。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
自定义镜像规范 - AI开发平台ModelArts

置里面。代码示例请参见train_params.json示例。 “dataset_readme.md” 必选文件，数据集要求说明，定义了模型训练时对数据集的要求，会显示在微调工作流的“准备数据”页面。自定义镜像规范（推理）当托管自定义镜像到AI Gallery时，如果镜像要支持AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
MiniCPM-V2.6基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

华为方技术支持购买DevServer资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B单机。表1 环境要求名称版本 driver 23.0.6 PyTorch pytorch_2.1.0

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

https://github.com/huggingface/diffusers.git -b v0.11.1-patch git clone Hugging Face上的模型，以SD模型为例。如果下载时若出现“SSL_ERROR_SYSCALL”报错，多重试几次即可。另外由于网络限制以及文件较大，下载

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_tools # 推理工具工作目录介绍详细的工作目录参考如下，建议参考以下要求设置工作目录。训练脚本以分类的方式集中在scripts文件夹中。 ${workdir}（例如/home/ma-user/ws ） |──llm_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.907版本，请参考表1获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。确保容器可以访问公网。资源规格要求推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。软件配套版本表1 获取软件分类名称获取路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

创建训练作业（预置框架）参数名称说明创建方式选择“自定义算法”。启动方式选择“预置框架”，引擎选择“PyTorch”，PyTorch版本根据训练要求选择。代码目录选择OBS桶中训练code文件夹所在路径，例如“obs://test-modelarts/code/”。启动文件选择

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档中的模型运行环境是ModelArts Lite DevServer。镜像适配的Cann版本是cann_8.0.RC3。 DevServer驱动版本要求23.0.6 PyTorch版本：2.2.0 Python版本：3.10 确保容器可以访问公网。仅支持313T、376T、400T 训练支持的模型列表

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

推理部署使用的服务框架是vLLM。vLLM支持v0.5.0版本。仅支持FP16和BF16数据类型推理。本案例仅支持在专属资源池上运行。专属资源池驱动版本要求23.0.6。支持的模型列表和权重文件本方案支持vLLM的v0.5.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

总条数： 438

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备镜像 - AI开发平台ModelArts

使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

将模型部署为批量推理服务 - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

MiniCPM-V2.6基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线