搜索_华为云

ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

ModelArts在线服务预测请求体大小限制是多少？服务部署完成且服务处于运行中后，可以往该服务发送推理的请求，请求的内容根据模型的不同可以是文本，图片，语音，视频等内容。当使用调用指南页签中显示的调用地址（华为云APIG网关服务的地址）预测时，对请求体的大小限制是12MB，超过12MB时，请求会被拦截。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
升级模型服务 - AI开发平台ModelArts

升级模型服务在AI开发过程中，服务升级包括对已部署的模型服务进行优化，以提高性能、增加功能、修复缺陷，并适应新的业务需求。更新模型版本作为服务升级的一部分，涉及用新训练的模型版本替换原来的模型，以提高预测的准确性和模型的环境适应性。登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
切换Lite Server服务器操作系统 - AI开发平台ModelArts

切换Lite Server服务器操作系统场景描述 Lite Server为一台弹性裸金属服务器，您可以使用BMS服务提供的切换操作系统功能，对Lite Server资源操作系统进行切换。本文介绍以下三种切换操作系统的方式：在BMS控制台切换操作系统使用BMS Go SDK的方式切换操作系统

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
模型的自定义镜像制作流程 - AI开发平台ModelArts

模型的自定义镜像制作流程如果您使用了ModelArts不支持的AI引擎开发模型，也可通过制作自定义镜像，导入ModelArts创建为模型，并支持进行统一管理和部署为服务。制作流程场景一：预置镜像的环境软件满足要求，只需要导入模型包，就能用于创建模型，通过镜像保存功能制作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
PD分离部署使用说明 - AI开发平台ModelArts

PD分离部署使用说明什么是PD分离部署大模型推理是自回归的过程，有以下两阶段： Prefill阶段（全量推理）将用户请求的prompt传入大模型，进行计算，中间结果写入KVCache并推出第1个token，属于计算密集型。 Decode阶段（增量推理）将请求的前1个tok

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
导入模型 - AI开发平台ModelArts
导入模型 - AI开发平台ModelArts

导入模型导入模型功能包括：初始化已存在的模型，根据模型ID生成模型对象。创建模型。模型对象的属性，请参见查询模型详情。示例模型文件以PyTorch为例，编写模型文件。PyTorch模型包结构可参考模型包规范介绍。 OBS桶/目录名 ├── resnet │ ├── model

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
Prefix Caching - AI开发平台ModelArts

Prefix Caching 什么是Prefix Caching 在LLM推理应用中，经常会面临具有长system prompt的场景以及多轮对话的场景。长system prompt的场景，system prompt在不同的请求中但是相同的，KV Cache的计算也是相同的；多轮

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
创建AI应用 - AI开发平台ModelArts

创建AI应用功能介绍导入元模型创建AI应用。执行代码、模型需先上传至OBS（训练作业生成的模型已默认存储到OBS）。接口约束使用模板导入模型与不使用模板导入这两类导入方式的Body参数要求不一样。以下Body参数说明中以模板参数表示适合使用模板导入模型时填写的参数，非模

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

基于MindSpore Lite的模型转换迁移推理业务的整体流程如下：模型准备转换关键参数准备模型转换推理应用适配主要通过MindSpore Lite（简称MSLite）进行模型的转换，进一步通过MindSpore Runtime支持昇腾后端的能力来将推理业务运行到昇腾设备上。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
SDK简介 - AI开发平台ModelArts
SDK简介 - AI开发平台ModelArts

SDK简介 ModelArts服务软件开发工具包（ModelArts SDK）是对ModelArts服务提供的REST API进行的Python封装，以简化用户的开发工作。用户直接调用ModelArts SDK即可轻松管理数据集、启动AI训练以及生成模型并将其部署为在线服务。 ModelArts

帮助中心 > AI开发平台ModelArts > SDK参考
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？问题定位和处理创建模型失败有两种场景：创建模型时直接报错或者是调用API报错和创建模型任务下发成功，但最终模型创建失败。创建模型时直接报错或者是调用API报错。一般都是输入参数不合法导致的。您可以根据提示信息进行排查修改即可。创建模型任务

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
MoXing进阶用法的样例代码 - AI开发平台ModelArts

MoXing进阶用法的样例代码如果您已经熟悉了常用操作，同时熟悉MoXing Framework API文档以及常用的Python编码，您可以参考本章节使用MoXing Framework的一些进阶用法。读取完毕后将文件关闭当读取OBS文件时，实际调用的是HTTP连接读取网

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
训练管理（旧版） - AI开发平台ModelArts

训练管理（旧版）训练作业训练作业参数配置可视化作业资源和引擎规格接口作业状态参考父主题：历史API

帮助中心 > AI开发平台ModelArts > API参考 > 历史API
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" 问题现象在程序运行过程中，出现如下类似错误。 1.‘failed call to cuInit: CUDA_ERROR_NO_DEVICE: no CUDA-capable device is detected’

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
msprobe精度分析工具使用指导 - AI开发平台ModelArts

msprobe精度分析工具使用指导 msprobe是MindStudio Training Tools工具链下精度调试部分的工具包，其通过采集和对比标杆（GPU/CPU）环境和昇腾环境上运行训练时的差异点来判断问题所在，主要包括精度预检、精度比对和梯度监控等功能。更多内容请参考msprobe工具介绍。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
附录：微调训练常见问题 - AI开发平台ModelArts

附录：微调训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 ModelArts集成了多个昇腾迁移调优工具，方便您在ModelArts平台环境中进行训练推理迁移、精度调试、性能调优等工作，您可在下表中查看当前ModelArts支持的昇腾迁移调优工具及对应指导。表格中的部分工具已集成到ModelArt

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
msprobe精度比对 - AI开发平台ModelArts

msprobe精度比对精度比对功能主要针对两类场景的问题：同一模型，从CPU或GPU移植到NPU中存在精度下降问题，对比NPU芯片中的API计算数值与CPU或GPU芯片中的API计算数值，进行问题定位。同一模型，进行迭代（模型、框架版本升级或设备硬件升级）时存在的精度下降问

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
用户执行huaweicloud.com相关API超时 - AI开发平台ModelArts

用户执行huaweicloud.com相关API超时问题现象用户在Notebook里通过request请求接口时超时：GET pangu-xxx.cn-southwest-2.myhuaweicloud.com。原因分析在Notebook中访问公网需要通过代理，访问huawei

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
将模型部署为批量推理服务 - AI开发平台ModelArts

将模型部署为批量推理服务模型准备完成后，您可以将模型部署为批量服务。在“模型部署>批量服务”界面，列举了用户所创建的批量服务。前提条件数据已完成准备：已在ModelArts中创建状态“正常”可用的模型。准备好需要批量处理的数据，并上传至OBS目录。已在OBS创建至少1个空的文件夹，用于存储输出的内容。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测

总条数： 711

上一页
1
...
24
25
26
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

升级模型服务 - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

导入模型 - AI开发平台ModelArts

Prefix Caching - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

SDK简介 - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

MoXing进阶用法的样例代码 - AI开发平台ModelArts

训练管理（旧版） - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

msprobe精度分析工具使用指导 - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

msprobe精度比对 - AI开发平台ModelArts

用户执行huaweicloud.com相关API超时 - AI开发平台ModelArts

将模型部署为批量推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线