搜索_华为云

分离部署推理服务 - AI开发平台ModelArts

负责输入的增量推理。增量推理占用至少1个容器。步骤八启动scheduler实例：可为CPU实例，用于启动api-server服务，负责接收推理请求，向全量或增量推理实例分发请求，收集推理结果并向客户端返回推理结果。服务调度实例不占用显卡资源，建议增加1个容器，也可以在全量推理或增量推理的容器上启动。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
查询预置算法 - AI开发平台ModelArts

查询预置算法功能介绍查看预置模型的详情。 URI GET /v1/{project_id}/built-in-algorithms 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

该指标用于统计测试对象的入方向网络流速。字节/秒（Bytes/Second） ≥0 NA NA NA 接收包速率 ma_container_network_receive_packets 每秒网卡接收的数据包个数。个/秒（Packets/Second） ≥0 NA NA NA 下行错包率

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Cluster资源池节点故障如何定位故障说明和处理建议图1 Lite池故障处理流程对于ModelArts Lite资源池，每个节点会以DaemonSet方式部署node-agent组件，该组件会检测节点状态，并将检测结果写到K8S NodeCondtition中。同时，节点

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

若需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何创建AI应用，部署模型并启动推理服务，在线预测服务。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
运行第一条Workflow - AI开发平台ModelArts

测试推理服务：工作流运行完成后，在服务部署节点右侧单击“实例详情”跳转至推理服务详情页。或者在ModelArts管理控制台，选择“部署上线>在线服务”，找到部署的推理服务，单击服务名称，进入服务详情页。单击“预测”，右边可查看预测结果。图6 预测样例图图7 预测结果父主题：使用Workflow实现低代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
非分离部署推理服务 - AI开发平台ModelArts

模型建议调大为6000) export HCCL_OP_EXPANSION_MODE=AIV #可选设置动态分档位后，在PTA模式下不支持接收超过最大档的并发请求，超过后会导致推理服务终止。请将最大档（PTA_TORCHAIR_DECODE_GEAR_LIST参数中设置的最大值）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

//docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/latest/getting_started/quickstart

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
查询数据集版本详情 - AI开发平台ModelArts

查询数据集版本详情功能介绍查询数据集版本详情。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datasets/{da

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
MaaS使用场景和使用流程 - AI开发平台ModelArts

MaaS使用场景和使用流程 ModelArts Studio大模型即服务平台（后续简称为MaaS服务），提供了简单易用的模型开发工具链，支持大模型定制开发，让模型应用与业务系统无缝衔接，降低企业AI落地的成本与难度。当您第一次使用MaaS服务时，可以参考快速入门使用ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

资源池”时，下方会出现提示：公共资源池暂未完全公开，如需申请使用，请联系与您对接的销售人员或拨打4000-955-988获得支持，您也可以在线提交售前咨询。如果不支持公共资源池，“公共资源池”按钮会置灰，鼠标悬停时，会提示：该模型版本暂不支持公共资源池部署。步骤一：在MaaS控制台领取免费体验额度

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 使用MaaS DeepSeek API搭建AI应用
基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

资源池”时，下方会出现提示：公共资源池暂未完全公开，如需申请使用，请联系与您对接的销售人员或拨打4000-955-988获得支持，您也可以在线提交售前咨询。如果不支持公共资源池，“公共资源池”按钮会置灰，鼠标悬停时，会提示：该模型版本暂不支持公共资源池部署。步骤一：在MaaS控制台领取免费体验额度

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理应用
查询数据集的版本列表 - AI开发平台ModelArts

查询数据集的版本列表功能介绍查询指定数据集的版本列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datasets

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Standard支持的AI框架 - AI开发平台ModelArts

开发环境的Notebook，根据不同的工作环境，对应支持的镜像和版本有所不同。表3 新版Notebook支持的镜像镜像名称镜像描述适配芯片支持SSH远程开发访问支持在线JupyterLab访问 pytorch1.8-cuda10.2-cudnn7-ubuntu18.04 CPU、GPU通用算法开发和训练基础镜像，预置AI引擎PyTorch1

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
PD分离部署使用说明 - AI开发平台ModelArts

负责输入的增量推理。增量推理占用至少1个容器。步骤四：启动scheduler实例：可为CPU实例，用于启动api-server服务，负责接收推理请求，向全量或增量推理实例分发请求，收集推理结果并向客户端返回推理结果。服务调度实例不占用显卡资源，建议增加1个容器，也可以在全量推理或增量推理的容器上启动。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 分离部署
PD分离部署使用说明 - AI开发平台ModelArts

负责输入的增量推理。增量推理占用至少1个容器。步骤四：启动scheduler实例：可为CPU实例，用于启动api-server服务，负责接收推理请求，向全量或增量推理实例分发请求，收集推理结果并向客户端返回推理结果。服务调度实例不占用显卡资源，建议增加1个容器，也可以在全量推理或增量推理的容器上启动。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

//docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/latest/getting_started/quickstart

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
批量更新团队标注样本的标签 - AI开发平台ModelArts

批量更新团队标注样本的标签功能介绍批量更新团队标注样本的标签。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI PUT /v2/{project_id}/data

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
批量更新样本标签 - AI开发平台ModelArts

批量更新样本标签功能介绍批量更新样本标签，包括添加、修改和删除样本标签。当请求体中单个样本的“labels”参数传空列表时，表示删除该样本的标签。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

性，屏蔽了大量AI模型开发使用过程中的技术细节，并制定了统一合理的规范。使用者可以便捷地使用、下载模型。同时支持用户上传自己的预训练模型到在线模型资产仓库中，并发布上架给其他用户使用。AI Gallery在原有Transformers库的基础上，融入了对于昇腾硬件的适配与支持。对

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型

总条数： 356

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分离部署推理服务 - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

运行第一条Workflow - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

查询数据集版本详情 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

Standard支持的AI框架 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

批量更新样本标签 - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线