搜索_华为云

场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档介绍了在ModelArts的Standard上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程，利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
启动DevServer实例 - AI开发平台ModelArts

of strings 允许通过SSH协议访问Notebook的公网IP地址白名单列表，默认都可以访问。当配置指定IP后，则仅允许IP所在的客户端实现对Notebook的访问。 dev_service String 支持的服务，枚举值如下： NOTEBOOK：可以通过https协议访问Notebook

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

com/Qwen-VL/assets/demo.jpeg</img>图片上有什么"}]}' 参数说明 {server_name}：配置为服务端启动时监听的IP地址或者域名。 {server_port}：配置为服务端启动时监听的端口。图4 远程调用父主题： AIGC模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
在ModelArts Standard上运行GPU单机单卡训练任务 - AI开发平台ModelArts

改，修改结果可以通过commit命令持久化。上传镜像客户端上传镜像，是指在安装了容器引擎客户端的机器上使用docker命令将镜像上传到容器镜像服务的镜像仓库。如果容器引擎客户端机器为云上的ECS或CCE节点，根据机器所在区域有两种网络链路可以选择：如果机器与容器镜像仓库在同一区域，则上传镜像走内网链路。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
部署推理服务 - AI开发平台ModelArts

部署推理服务本章节介绍如何使用vLLM 0.3.2框架部署并启动推理服务。前提条件已准备好DevServer环境，具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9b资源。确保容器可以访问公网。 Step1 检查环境 SSH登录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
pipeline应用准备 - AI开发平台ModelArts

pipeline应用准备当前迁移路径是从ONNX模型转换到MindIR模型，再用MindSpore Lite做推理，所以迁移前需要用户先准备好自己的ONNX pipeline。下文以官方开源的图生图的Stable Diffusion v1.5的onnx pipeline代码为例进行说明。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 ModelArts Standard平台提供了模型推理部署功能，用户在已有模型的情况下，可以直接在Standard中导入模型，并部署为在线服务进行预测。本文以“商超商品识别”模型为例，介绍如何在ModelArts

帮助中心 > AI开发平台ModelArts > 快速入门
在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务本章节介绍如何在ModelArts的推理生产环境（ModelArts控制台的在线服务功能）中部署推理服务。 Step1 准备模型文件和权重文件在OBS桶中，创建文件夹，准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

# MindSpeed昇腾大模型加速库 |──ModelLink/ # ModelLink端到端的大语言模型方案 |——megatron/ # 注意：该文件夹从Megatron-LM中复制得到

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

# MindSpeed昇腾大模型加速库 |──ModelLink/ # ModelLink端到端的大语言模型方案 |——megatron/ # 注意：该文件夹从Megatron-LM中复制得到

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

listic shot of a furry blue bird"}' 服务端打印如下信息，表示发送请求成功。图4 发送请求客户端返回图像的base64编码。图5 图像的base64编码将客户端返回的base64编码转换为图片。 from PIL import Image

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
分离部署推理服务 - AI开发平台ModelArts

启动scheduler实例：可为CPU实例，用于启动api-server服务，负责接收推理请求，向全量或增量推理实例分发请求，收集推理结果并向客户端返回推理结果。服务调度实例不占用显卡资源，建议增加1个容器，也可以在全量推理或增量推理的容器上启动。前提条件已准备好DevServer环

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
部署推理服务 - AI开发平台ModelArts

部署推理服务本章节介绍如何使用vLLM 0.4.2框架部署并启动推理服务。前提条件已准备好DevServer环境，具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9b资源。安装过程需要连接互联网git clone，确保容器可以访问公网。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

使用VSCode-huawei，报错：卸载了‘ms-vscode-remote.remot-sdh’，它被报告存在问题使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配 VSCode远程连接时卡顿，或Python调试插件无法使用如何处理？父主题：开发环境

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
分离部署推理服务 - AI开发平台ModelArts

启动scheduler实例：可为CPU实例，用于启动api-server服务，负责接收推理请求，向全量或增量推理实例分发请求，收集推理结果并向客户端返回推理结果。服务调度实例不占用显卡资源，建议增加1个容器，也可以在全量推理或增量推理的容器上启动。前提条件已准备好DevServer环

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
更新Notebook实例 - AI开发平台ModelArts

endpoints 否 Array of EndpointsReq objects 本地IDE（如PyCharm、VS Code）或SSH客户端，通过SSH远程接入Notebook实例时需要的相关配置。 flavor 否 String 支持变更实例规格，支持变更的规格可以通过本章节的查询支持可切换规格列表的API获取。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

of strings 允许通过SSH协议访问Notebook的公网IP地址白名单列表，默认都可以访问。当配置指定IP后，则仅允许IP所在的客户端实现对Notebook的访问。 dev_service String 支持的服务，枚举值如下： NOTEBOOK：可以通过https协议访问Notebook

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

# MindSpeed昇腾大模型加速库 |──ModelLink/ # ModelLink端到端的大语言模型方案 |——megatron/ # 注意：该文件夹从Megatron-LM中复制得到

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
查询用户所有DevServer实例列表 - AI开发平台ModelArts

of strings 允许通过SSH协议访问Notebook的公网IP地址白名单列表，默认都可以访问。当配置指定IP后，则仅允许IP所在的客户端实现对Notebook的访问。 dev_service String 支持的服务，枚举值如下： NOTEBOOK：可以通过https协议访问Notebook

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

# MindSpeed昇腾大模型加速库 |──ModelLink/ # ModelLink端到端的大语言模型方案 |——megatron/ # 注意：该文件夹从Megatron-LM中复制得到

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作

总条数： 330

上一页
1
...
12
13
14
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景介绍 - AI开发平台ModelArts

启动DevServer实例 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练任务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

pipeline应用准备 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

更新Notebook实例 - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

查询用户所有DevServer实例列表 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线