搜索_华为云

ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

Gallery简介使用指导发布和管理AI Gallery模型发布和管理AI Gallery的AI应用 08 SDK ModelArts服务软件开发工具包（ModelArts SDK）是对ModelArts服务提供的REST API进行的Python封装，以简化用户的开发工作。 SDK文档

 帮助中心 > AI开发平台ModelArts > 成长地图
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

# nerdctl 工具查看 nerdctl --namespace k8s.io image list Step3 制作推理镜像获取模型软件包，并上传到机器SFS Turbo的目录下（可自定义路径），获取地址参考表1。解压AscendCloud压缩包及该目录下的推理代码AscendCloud-LLM-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本方案目前仅适用于企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.911版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts Lite Cluster。本文档中的CCE集群版本选择v1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.912版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

可以使用ModelArts提供的以下认证方式： token认证 AK/SK APP认证 WebSocket服务调用步骤如下（以图形界面的软件Postman进行预测，token认证为例）： WebSocket连接的建立 WebSocket客户端和服务端双向传输数据 WebSocket连接的建立

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.910版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本方案目前仅适用于企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.910版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts Lite Cluster。本文档中的CCE集群版本选择v1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本方案目前仅适用于企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts6.3.912版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts Lite Cluster。本文档中的CCE集群版本选择v1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
Lite Server资源开通 - AI开发平台ModelArts

onfig网络配置程序、Cloud-init初始化工具等）。请根据您的实际需要自助配置应用环境或相关软件。ModelArts服务提供镜像支持多种操作系统，内置AI场景相关驱动和软件，预置ModelArts自定义OS优化组件，当前支持的镜像请参考Lite Server算力资源和镜像版本配套关系。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

使用模型服务：在MaaS体验模型服务，测试推理结果。结果分析：分析模型的调优结果和推理结果，对比新闻分类效果。方案优势高准确性：利用模型强大的语义理解能力，系统能够准确识别新闻内容的主题和关键词，实现高准确率的自动分类。快速响应：系统能够实时处理新闻内容，快速完成分类，满足新闻时效性的要求。可扩展性：随着

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
创建Workflow模型注册节点 - AI开发平台ModelArts

执行代码存放的OBS地址，默认值为空，名称固定为“customize_service.py”。推理代码文件需存放在模型“model”目录。该字段不需要填，系统也能自动识别出model目录下的推理代码。否 str dependencies 推理代码及模型需安装的包，默认为空。从配置文件读取。否 str model_metrics

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
推理性能测试 - AI开发平台ModelArts

静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step5 进入容器安装推理依赖软件步骤中已经上传过AscendCloud-LLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，切换一

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
推理性能测试 - AI开发平台ModelArts

静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step5 进入容器安装推理依赖软件步骤中已经上传过AscendCloud-3rdLLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，执行如下命令安装性能测试的关依赖。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.911版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

# nerdctl 工具查看 nerdctl --namespace k8s.io image list Step3 制作推理镜像获取模型软件包，并上传到机器SFS Turbo的目录下（可自定义路径），获取地址参考表1。解压AscendCloud压缩包及该目录下的推理代码AscendCloud-LLM-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
准备推理环境 - AI开发平台ModelArts

建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表1。 docker pull {image_url} 步骤三：上传代码包和权重文件上传安装依赖软件推理代码AscendCloud-LLM-6.3.912-xxx.zip和算子包AscendCloud-OPP-6.3.912-xxx.zip到主机中，包获取路径请参见表2。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.912版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.910版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
准备BF16权重 - AI开发平台ModelArts

“deepseekv2”。转换后的权重文件再复制到其它三台机器的相同目录。如果是新开的Server机器则需要安装torch、tqdm等软件包，具体命令如下 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tqdm

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 > 准备权重
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

ECS中构建新镜像（二选一）通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压AscendCloud压缩包及该目录下的训练代码AscendCloud-LLM-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作

总条数： 358

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

创建Workflow模型注册节点 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备推理环境 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备BF16权重 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线