搜索_华为云

查看ModelArts模型详情 - AI开发平台ModelArts

请求模式在线服务的请求模式。同步请求：单次推理，可同步返回结果（约<60s）。例如: 图片、较小视频文件。异步请求：单次推理，需要异步处理返回结果（约>60s）。例如: 实时视频推理、大视频文件。创建时间 AI应用的创建时间。描述 AI应用的描述。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
从容器镜像中选择元模型 - AI开发平台ModelArts

“部署类型” 选择此AI应用支持部署服务的类型，部署上线时只支持部署为此处选择的部署类型，例如此处只选择在线服务，那您导入后只能部署为在线服务。当前支持“在线服务”、“批量服务”和“边缘服务”。 “启动命令” 指定模型的启动命令，您可以自定义该命令。

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 管理AI应用 > 创建AI应用
从容器镜像中导入AI应用文件创建模型 - AI开发平台ModelArts

“部署类型” 选择此AI应用支持部署服务的类型，部署上线时只支持部署为此处选择的部署类型，例如此处只选择在线服务，那您导入后只能部署为在线服务。当前支持“在线服务”、“批量服务”和“边缘服务”。 “启动命令” 指定模型的启动命令，您可以自定义该命令。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

在线服务在线推理服务，可以实现高并发，低延时，弹性伸缩，并且支持多模型灰度发布、A/B测试。将模型部署为一个Web Service，并且提供在线的测试UI与监控能力。

帮助中心 > AI开发平台ModelArts > 功能总览
管理AI Gallery镜像 - AI开发平台ModelArts

单击文件名称即可在线预览文件内容。仅支持预览大小不超过10MB、格式为文本类或图片类的文件。下载文件在镜像详情页，选择“镜像文件”页签。单击操作列的“下载”，选择保存路径单击“确认”，即可下载文件到本地。删除文件在镜像详情页，选择“镜像文件”页签。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
推理精度测试 - AI开发平台ModelArts

若要在生产环境中进行精度测试，还需修改benchmark_eval/config/config.json中app_code，app_code获取方式见访问在线服务（APP认证）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
ModelArts入门实践 - AI开发平台ModelArts

本案例详细介绍如何使用自定义镜像创建AI应用，并部署成在线服务。

帮助中心 > AI开发平台ModelArts > 快速入门
【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

您可以通过链接下载ATC模型转换工具，按照指导，在线下转换成.om格式模型。 ModelArts中是否还会增加模型转换的能力？ ModelArts开发环境中在贵阳一Region，支持将ONNX或PyTorch模型转换到.mindir格式。其它能力在持续增加中。

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

进入“ModelArts>部署上线>在线服务”页面，检查是否有“运行中”的推理作业。如果有，单击该作业列表右方操作下的“停止”即可停止计费。进入“ModelArts>部署上线>批量服务”页面，检查是否有“运行中”的推理作业。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
附录：大模型推理standard常见问题 - AI开发平台ModelArts

AttributeError: type object 'LlamaAttention' has no attribute '_init_rope' 解决方法：降低transformers版本到4.42：pip install transformers==4.42 --upgrade 问题6：部署在线服务报错

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

进入“ModelArts>部署上线>在线服务”页面，检查是否有“运行中”的推理作业。如果有，单击该作业列表右方操作下的“停止”即可停止计费。进入“ModelArts>部署上线>批量服务”页面，检查是否有“运行中”的推理作业。

帮助中心 > AI开发平台ModelArts > 常见问题 > 计费相关
准备Notebook（可选） - AI开发平台ModelArts

存储支持在线按需扩容。图2 自定义存储配置使用Notebook将OBS数据导入云硬盘EVS 打开已创建的Notebook实例，选择Notebook的python-3.9.10，即可编辑Untitled.ipynb文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
准备Notebook（可选） - AI开发平台ModelArts

存储支持在线按需扩容。图2 自定义存储配置使用Notebook将OBS数据导入云硬盘EVS 打开已创建的Notebook实例，选择Notebook的python-3.9.10，即可编辑Untitled.ipynb文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作
从AI Gallery订阅模型 - AI开发平台ModelArts

图1 进入“我的订阅” 在展开的版本列表中，单击“部署 > 在线服务”跳转至部署页面。图2 部署模型若您选择部署的是商用模型，则选择服务类型后会弹出“修改配额”窗口，根据需要选择配额后单击“确定”即可跳转至“部署”页面。

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 管理AI应用 > 订阅模型
从AI Gallery订阅模型 - AI开发平台ModelArts

图1 进入“我的订阅” 在展开的版本列表中，单击“部署 > 在线服务”跳转至部署页面。图2 部署模型如果您选择部署的是商用模型，则选择服务类型后会弹出“修改配额”窗口，根据需要选择配额后单击“确定”即可跳转至“部署”页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用
从对象存储服务（OBS）中选择元模型 - AI开发平台ModelArts

“部署类型” 选择此AI应用支持部署服务的类型，部署上线时只支持部署为此处选择的部署类型，例如此处只选择在线服务，那您导入后只能部署为在线服务。当前支持“在线服务”、“批量服务”和“边缘服务”。 “启动命令” 选填参数，指定模型的启动命令，您可以自定义该命令。

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 管理AI应用 > 创建AI应用
从OBS中导入AI应用文件创建模型 - AI开发平台ModelArts

“部署类型” 选择此AI应用支持部署服务的类型，部署上线时只支持部署为此处选择的部署类型，例如此处只选择在线服务，那您导入后只能部署为在线服务。当前支持“在线服务”、“批量服务”和“边缘服务”。 “启动命令” 选填参数，指定模型的启动命令，您可以自定义该命令。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

AI推理应用运行在昇腾设备上一般有两种方式：方式1：通过Ascend PyTorch，后端执行推理，又称在线推理。方式2：通过模型静态转换后，执行推理，又称离线推理。通常为了获取更好的推理性能，推荐使用方式2的离线推理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

在线上，模型文件从OBS下载到/home/mind/model目录之后，文件owner将统一修改为ma-user。在本地机器上启动另一个终端，执行以下验证指令，得到符合预期的推理结果。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署

总条数： 1009

上一页
1
...
11
12
13
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看ModelArts模型详情 - AI开发平台ModelArts

从容器镜像中选择元模型 - AI开发平台ModelArts

从容器镜像中导入AI应用文件创建模型 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

管理AI Gallery镜像 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

ModelArts入门实践 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

附录：大模型推理standard常见问题 - AI开发平台ModelArts

如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

准备Notebook（可选） - AI开发平台ModelArts

准备Notebook（可选） - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

从对象存储服务（OBS）中选择元模型 - AI开发平台ModelArts

从OBS中导入AI应用文件创建模型 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线