搜索_华为云

在推理生产环境中部署推理服务 - AI开发平台ModelArts

如果权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“部署上线 > 在线服务 > 部署”，开始部署在线服务。图5 部署在线服务设置部署服务名称，选择Step2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 - AI开发平台ModelArts

DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导方案概述准备权重部署推理服务附录：rank_table_file.json文件附录：config.json文件附录：部署常见问题父主题： DeepSeek系列模型推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“模型部署 > 在线服务 > 部署”，开始部署在线服务。设置部署服务名称，选择Step2 部署模型中创建的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？问题描述从OBS中或者从容器镜像中导入模型时，开发者需要编写模型配置文件。模型配置文件描述模型用途、模型计算框架、模型精度、推理代码依赖包以及模型对外API接口。配置文件为JSON格式。配置文件中的“depen

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
推理服务部署 - AI开发平台ModelArts

推理服务部署准备推理环境启动推理服务父主题：主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

在实际流程中，通过设定训练指标对模型进行监控，以确保效果符合预期。在微调后，评估用户模型，并进行最终优化，确认其满足业务需求后，进行部署和调用，以便实际应用。科学计算大模型选择建议科学计算大模型支持训练的模型类型有：全球中期天气要素模型、降水模型、区域中期海洋智能预测模型。全球中期天气要素预测模型、降水模型选择建议：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

选择”，元模型选择至model目录，AI引擎选择Custom，引擎包选择步骤3构建的镜像。图3 创建模型将创建的模型部署为在线服务，大模型加载启动的时间一般大于普通的模型创建的服务，请配置合理的“部署超时时间”，避免尚未启动完成被认为超时而导致部署失败。图4 部署为在线服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
评估模型 - 企业级AI应用开发专业套件 ModelArts Pro

已在视觉套件控制台选择“零售商品识别工作流”新建应用，并训练模型，详情请见训练模型。评估模型在“模型评估”页面，您可以针对当前版本的模型进行模型评估，查看评估参数对比和详细评估，也可以模拟在线测试。图1 模型评估模型评估 “模型评估”下侧显示当前模型的版本、标签数量、验证集数量。评估参数对比

 帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 用户指南 > 视觉套件 > 零售商品识别工作流
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

型（即自定义模型），则模型文件必须满足自定义模型规范（推理）才支持模型自定义推理。当使用自定义镜像部署推理服务时，要确认镜像是否满足自定义镜像规范，否则无法成功完成推理服务的部署。部署推理服务登录AI Gallery。单击“模型”进入模型列表。选择需要部署为推理服务的模型，单击模型名称进入模型详情页。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
模型管理简介 - 网络智能体
模型管理简介 - 网络智能体

、创建联邦学习实例、发布成在线推理服务。具体操作请参见表1。表1 模型管理操作参数名称参数描述模型名称模型的名称，与模型打包时保持一致。模型版本模型的版本，与模型打包时保持一致。模型描述模型的描述内容，与模型打包时保持一致。不能超过256个字符。上架状态模型包的发布状态：

帮助中心 > 网络智能体 > 模型训练服务 > 用户指南 > 模型管理
模型开发 - 盘古大模型 PanguLargeModels

4量化压缩。模型部署：平台提供了一键式模型部署功能，用户可以轻松将训练好的模型部署到云端或本地环境中。平台支持多种部署模式，能够满足不同场景的需求。通过灵活的API接口，模型可以无缝集成到各类应用中。模型调用：在模型部署后，用户可以通过模型调用功能快速访问模型的服务。平台提供

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
使用SpringBoot应用部署模板创建并部署应用 - 部署 CodeArts Deploy

使用SpringBoot应用部署模板创建并部署应用在主机上部署SpringBoot框架的Java后台应用，并启动该服务。请确认目标主机已安装JDK，若已安装请移除模板中“安装JDK”步骤。该模板涉及的部署步骤如下所示：安装JDK 选择部署来源停止SpringBoot服务

 帮助中心 > 部署 CodeArts Deploy > 用户指南 > 使用预置模板新建并部署应用
在ModelArts中导入模型对于镜像大小有什么限制？ - AI开发平台ModelArts

在ModelArts中导入模型对于镜像大小有什么限制？ ModelArts部署使用的是容器化部署，容器运行时有空间大小限制，当用户的模型文件或者其他自定义文件，系统文件超过容器引擎空间大小时，会提示镜像内空间不足。当前，公共资源池容器引擎空间的大小最大支持50G，专属资源池容器

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
使用ModelArts Standard自动学习实现口罩检测 - AI开发平台ModelArts

在“确认是否继续允许”的弹窗中，单击“确定”，工作流会继续从数据标注节点依次运行到服务部署节点。该段时间不需要用户做任何操作。当工作流运行到“服务部署”节点，“服务部署”节点会变成橙色，双击“服务部署”节点。在服务部署页签中，可以看到状态变为了“等待输入”。需要选择填写以下两个参数，其他参数均为默认值，保持不变。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
方案概述 - AI开发平台ModelArts
方案概述 - AI开发平台ModelArts

场景描述本方案介绍了在ModelArts的Lite Server上使用昇腾计算资源开展DeepSeek R1和DeepSeek V3模型推理部署的详细过程。推理框架使用MindIE。资源规划本方案推荐用户使用W8A8量化权重，需要2台Ascend Snt9B资源。Snt9B资源的单卡显存不低于64GB。

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
实施步骤 - 工业数字模型驱动引擎

Server，简称ECS）为例，基于智能边缘小站（CloudPond）部署工业数字模型驱动引擎（Industrial Digital Model Engine，简称iDME）服务。步骤1：登录云服务器登录待部署iDME的云服务器，具体操作请参见Linux弹性云服务器登录方式概述。

帮助中心 > 工业数字模型驱动引擎 > 最佳实践 > 基于智能边缘小站手动部署iDME应用
模型训练服务简介 - 网络智能体

联邦学习&重训练，保障模型应用效果支持联邦学习，模型可以采用多地数据进行联合训练，提升样本多样性，提升模型效果支持迁移学习，只需少量数据即可完成非首站点模型训练，提升模型泛化能力模型自动重训练，持续优化模型效果，解决老化劣化问题预置多种高价值通信增值服务，缩短模型交付周期

 帮助中心 > 网络智能体 > 模型训练服务 > 用户指南
在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

在ModelArts中训练好后的模型如何获取？使用自动学习产生的模型只能在ModelArts上部署上线，无法下载至本地使用。使用自定义算法或者订阅算法训练生成的模型，会存储至用户指定的OBS路径中，供用户下载。父主题： Standard模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

通过公网访问通道的方式访问在线服务背景描述 ModelArts推理默认使用公网访问在线服务。在线服务部署成功后，将为用户提供一个可调用的API，此API为标准Restful API。您可以在服务详情页面，调用指南页签中查看API接口公网地址。图1 API接口公网地址约束限制

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？ - AI开发平台ModelArts

创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？问题现象创建模型时，元模型来源指定的OBS目录下存放了自定义的文件和文件夹，都会复制到镜像中去。复制进去的路径是什么，怎么读取对应的文件或者文件夹里面的内容？原因分析通过OBS导入模型时，ModelArts会将指

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理

总条数： 10000

上一页
1
...
10
11
12
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在推理生产环境中部署推理服务 - AI开发平台ModelArts

DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

推理服务部署 - AI开发平台ModelArts

科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

评估模型 - 企业级AI应用开发专业套件 ModelArts Pro

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

模型管理简介 - 网络智能体

模型开发 - 盘古大模型 PanguLargeModels

使用SpringBoot应用部署模板创建并部署应用 - 部署 CodeArts Deploy

在ModelArts中导入模型对于镜像大小有什么限制？ - AI开发平台ModelArts

使用ModelArts Standard自动学习实现口罩检测 - AI开发平台ModelArts

方案概述 - AI开发平台ModelArts

实施步骤 - 工业数字模型驱动引擎

模型训练服务简介 - 网络智能体

在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线