搜索_华为云

推理性能测试 - AI开发平台ModelArts

静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step5 进入容器安装推理依赖软件步骤中已经上传过AscendCloud-LLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，切换一

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
推理性能测试 - AI开发平台ModelArts

静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step5 进入容器安装推理依赖软件步骤中已经上传过AscendCloud-3rdLLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，执行如下命令安装性能测试的关依赖。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

# nerdctl 工具查看 nerdctl --namespace k8s.io image list Step3 制作推理镜像获取模型软件包，并上传到机器SFS Turbo的目录下（可自定义路径），获取地址参考表1。解压AscendCloud压缩包及该目录下的推理代码AscendCloud-LLM-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

Gallery简介使用指导发布和管理AI Gallery模型发布和管理AI Gallery的AI应用 08 SDK ModelArts服务软件开发工具包（ModelArts SDK）是对ModelArts服务提供的REST API进行的Python封装，以简化用户的开发工作。 SDK文档

 帮助中心 > AI开发平台ModelArts > 成长地图
自动学习/Workflow计费项 - AI开发平台ModelArts

创建桶不收取费用，按实际使用的存储容量和时长收费消息通知（不开启则不计费）消息通知服务订阅消息使用消息通知服务，在事件列表中选择需要监控的节点/Workflow状态，在事件发生时发送消息通知。如果想使用消息通知，需要提前在自动学习、Workflow中开启消息通知功能。具体计费可见消息通知服务价格详情。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

服务详情”，在弹窗中选择“指标效果”页签，可以查看推理效果。支持设置时间区间，查看不同时间下的推理效果。仅当推理服务处于“运行中”，才支持查看监控指标。表2 推理效果的指标介绍指标名称指标说明 CPU使用率在推理服务启动过程中，机器的CPU占用情况。内存使用率在推理服务启动过程中，机器的内存占用情况。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
运行第一条Workflow - AI开发平台ModelArts

启动该工作流。其中涉及手动确认的节点仍会在运行到时停止，不会自动执行。服务配置消息通知订阅消息使用消息通知服务，在事件列表中选择需要监控的节点或者Workflow状态，在事件发生时发送消息通知。说明：打开开关后，需要先指定SMN主题名，如未创建主题名，需前往消息通知服务创建主题。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.910版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts Lite DevServer。镜像适配的Cann版本是cann_8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

pytorch_2.1.0 驱动 23.0.6 获取镜像分类名称获取路径插件代码包 AscendCloud-6.3.909-xxx.zip软件包中的AscendCloud-AIGC-6.3.909-xxx.zip，AscendCloud-OPP-6.3.909-xxx.zip 说明：

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

ECS中构建新镜像（二选一）通过ECS获取和上传基础镜像获取基础镜像后，可通过ECS运行Dockerfile文件，在镜像的基础上构建新镜像。获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压AscendCloud压缩包及该目录下的训练代码AscendCloud-LLM-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
什么是Workflow - AI开发平台ModelArts

Workflow 区别于传统的机器学习模型构建，开发者可以使用Workflow开发生产流水线。基于MLOps的概念，Workflow会提供运行记录、监控、持续运行等功能。根据角色的分工与概念，产品上将工作流的开发和持续迭代分开。一条流水线由多个节点组成，Workflow SDK提供了流水

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
查询训练作业版本列表 - AI开发平台ModelArts

model_metric_list String 训练作业的模型评测参数。具体请参见表7。 system_metric_list String 训练作业的系统监控指标。具体请参见表8。 user_image_url String 自定义镜像训练作业的自定义镜像的SWR-URL。 user_command

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询训练作业版本详情 - AI开发平台ModelArts

model_metric_list String 训练作业的模型评测参数。具体请参见表5。 system_metric_list Object 训练作业的系统监控指标。具体请参见表6。 user_image_url String 自定义镜像训练作业的自定义镜像的SWR-URL。 user_command

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

直接填写“预测代码”进行文本预测。选择“multipart/form-data”时，需填写“请求参数”，请求参数取值等同于使用图形界面的软件进行预测（以Postman为例）Body页签中填写的“KEY”的取值，也等同于使用curl命令发送预测请求上传数据的参数名。设置完成后，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
查看在线服务详情 - AI开发平台ModelArts

流、实例数、部署超时时间、环境变量、存储挂载等信息。专属资源池部署的服务，同时展示资源池信息。 “历史更新记录”：展示历史模型相关信息。监控信息展示当前服务的“资源统计信息”和“模型调用次数统计”。 “资源统计信息”：包括CPU、内存、GPU、NPU的可用和已用信息。 “模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
部署模型为在线服务 - AI开发平台ModelArts

默认关闭。如需开启此功能，请参见通过APP认证的方式访问在线服务了解详情并根据实际情况进行设置。 “订阅消息” - 订阅消息使用消息通知服务，在事件列表中选择需要监控的服务状态，在事件发生时发送消息通知。可选：配置高级选项。表3 高级选项参数说明参数名称说明故障自动重启开启该功能后，系统检测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
自定义模型规范 - AI开发平台ModelArts

PU）、CANN（NPU）。自定义模型使用的预置镜像 AI Gallery提供了PyTorch基础镜像，镜像里已经安装好了运行任务所需的软件，供自定义模型直接使用，快速进行训练、推理。预置镜像的版本信息请参见表3。表3 AI Gallery预置镜像列表引擎类型资源类型版本名称

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

直接填写“预测代码”进行文本预测。选择“multipart/form-data”时，需填写“请求参数”，请求参数取值等同于使用图形界面的软件进行预测（以Postman为例）Body页签中填写的“KEY”的取值，也等同于使用curl命令发送预测请求上传数据的参数名。设置完成后，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
数据管理权限 - AI开发平台ModelArts

{dataset_id}/data-annotations/stats modelarts:dataset:get - √ √ 查询数据集监控数据 GET /v2/{project_id}/datasets/{dataset_id}/metrics modelarts:dataset:get

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
部署在线服务 - AI开发平台ModelArts

h/edge。默认为real-time。 real-time代表在线服务，将模型部署为一个Web Service，并且提供在线的测试UI与监控能力，服务一直保持运行。 batch为批量服务，批量服务可对批量数据进行推理，完成数据处理后自动停止。 edge表示边缘服务，通过华为云智

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理

总条数： 315

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

自动学习/Workflow计费项 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

运行第一条Workflow - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

查询训练作业版本列表 - AI开发平台ModelArts

查询训练作业版本详情 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

数据管理权限 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线