搜索_华为云

使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

镜像容器镜像选择上一步上传到SWR的镜像。代码目录必填，选择训练代码文件所在的OBS目录。需要提前将代码上传至OBS桶中，目录内文件总大小要小于或等于5GB，文件数要小于或等于1000个，文件深度要小于或等于32。训练代码文件会在训练作业启动的时候被系统自动下载到训练容器的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档介绍了在ModelArts的Standard上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程，利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
Open-Sora-Plan1.0基于Lite Server适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

Open-Sora-Plan1.0基于Lite Server适配PyTorch NPU训练推理指导（6.3.907）本文档主要介绍如何在ModelArts Lite Server上，使用PyTorch_npu+华为自研Ascend Snt9B硬件，完成Open-Sora-Plan1

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档介绍了在ModelArts的Standard上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程，利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
分离部署推理服务 - AI开发平台ModelArts

如果使用模型训练后的权重文件进行推理，模型训练及训练后的权重文件转换操作可以参考相关文档章节中提供的模型训练文档。 3.权重要求放在磁盘的指定目录，并做目录大小检查，参考命令如下： df -h 步骤四制作推理镜像解压AscendCloud压缩包及该目录下的推理代码AscendCloud-LLM-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

exit. 表7 参数说明参数名参数类型是否必选参数说明 -ks / --keep-storage Int 否清理缓存时保留的缓存大小，单位是MB，默认是0，表示全部清理。 -kd / --keep-duration String 否清理缓存时保留较新的缓存，只清除历史

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

deepseek-v2-236B deepseek-coder-v2-lite-16B Ascend-vllm支持如下推理特性：支持分离部署支持多机推理支持大小模型投机推理及eagle投机推理支持chunked prefill特性支持automatic prefix caching 支持multi-lora特性

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
pipeline代码适配 - AI开发平台ModelArts

pipeline代码适配 onnx pipeline的主要作用是将onnx模型进行一系列编排，并在onnx Runtime上按照编排顺序执行。因此，需要将转换得到的mindir模型按照相同的逻辑进行编排，并在MindSpore Lite上执行。只需要将原始onnx的pipelin

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
分离部署推理服务 - AI开发平台ModelArts

如果使用模型训练后的权重文件进行推理，模型训练及训练后的权重文件转换操作可以参考相关文档章节中提供的模型训练文档。 3.权重要求放在磁盘的指定目录，并做目录大小检查，参考命令如下： df -h 步骤四制作推理镜像解压AscendCloud压缩包及该目录下的推理代码AscendCloud-LLM-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
删除Notebook实例 - AI开发平台ModelArts

建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。 size Long 镜像大小（单位KB）。 status String 镜像状态。枚举值如下： INIT：初始化。 CREATING：镜像保存中，此时Notebook不可用。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
昇腾云服务6.3.911版本说明 - AI开发平台ModelArts

qwen-vl qwen-vl-chat MiniCPM-v2 Ascend-vllm支持如下推理特性：支持分离部署支持多机推理支持大小模型投机推理及eagle投机推理支持chunked prefill特性支持automatic prefix caching 支持multi-lora特性

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
昇腾云服务6.3.910版本说明（推荐） - AI开发平台ModelArts

qwen-vl qwen-vl-chat MiniCPM-v2 Ascend-vllm支持如下推理特性：支持分离部署支持多机推理支持大小模型投机推理及eagle投机推理支持chunked prefill特性支持automatic prefix caching 支持multi-lora特性

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
自定义镜像使用场景 - AI开发平台ModelArts

自定义镜像使用场景在AI业务开发以及运行的过程中，一般都会有复杂的环境依赖需要进行调测并固化。面对开发中的开发环境的脆弱和多轨切换问题，在ModelArts的AI开发最佳实践中，通过容器镜像的方式将运行环境进行固化，以这种方式不仅能够进行依赖管理，而且可以方便的完成工作环境切换

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

5b-ov-hf llava-onevision-qwen2-7b-ov-hf Ascend-vllm支持如下推理特性：支持分离部署支持多机推理支持大小模型投机推理及eagle投机推理支持chunked prefill特性支持automatic prefix caching 支持multi-lora特性

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
查询Notebook实例详情 - AI开发平台ModelArts

建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。 size Long 镜像大小（单位KB）。 status String 镜像状态。枚举值如下： INIT：初始化。 CREATING：镜像保存中，此时Notebook不可用。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
分离部署推理服务 - AI开发平台ModelArts

如果使用模型训练后的权重文件进行推理，模型训练及训练后的权重文件转换操作可以参考相关文档章节中提供的模型训练文档。权重要求放在磁盘的指定目录，并做目录大小检查，参考命令如下： df -h Step4 制作推理镜像解压AscendCloud压缩包及该目录下的推理代码AscendCloud-LLM-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

如果使用模型训练后的权重文件进行推理，模型训练及训练后的权重文件转换操作可以参考相关文档章节中提供的模型训练文档。 3.权重要求放在磁盘的指定目录，并做目录大小检查，参考命令如下： df -h 步骤四制作推理镜像解压AscendCloud压缩包及该目录下的推理代码AscendCloud-LLM-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
功能总览 - AI开发平台ModelArts
功能总览 - AI开发平台ModelArts

功能总览功能总览全部自动学习 Workflow 开发工具算法管理训练管理 AI应用管理部署上线镜像管理资源池 AI Gallery ModelArts SDK 昇腾生态自动学习自动学习是帮助人们实现AI应用的低门槛、高灵活、零代码的定制化模型开发工具。自动学习

 帮助中心 > AI开发平台ModelArts > 功能总览
自动化脚本快速部署推理服务（推荐） - AI开发平台ModelArts

case "$1" in -n|--model_name) model_name=$2 # 忽略大小写 MODEL_NAME=$model_name shift 2 ;;

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 > 部署推理服务
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境场景描述本文旨在指导如何在GPU裸金属服务器上，安装NVIDIA、CUDA驱动等环境配置。由于不同GPU预置镜像中预安装的软件不同，您通过Lite Server算力资源和镜像版本配套关系章节查看已安装的软件。下面为常见的软件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境

总条数： 543

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Open-Sora-Plan1.0基于Lite Server适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

删除Notebook实例 - AI开发平台ModelArts

昇腾云服务6.3.911版本说明 - AI开发平台ModelArts

昇腾云服务6.3.910版本说明（推荐） - AI开发平台ModelArts

自定义镜像使用场景 - AI开发平台ModelArts

昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

查询Notebook实例详情 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

功能总览 - AI开发平台ModelArts

自动化脚本快速部署推理服务（推荐） - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线