搜索_华为云

访问在线服务支持的认证方式 - AI开发平台ModelArts

访问在线服务支持的认证方式通过Token认证的方式访问在线服务通过AK/SK认证的方式访问在线服务通过APP认证的方式访问在线服务父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
作为调用发起方的客户端无法访问已经获取到的推理请求地址 - AI开发平台ModelArts

完成在线服务部署且服务处于“运行中”状态后，已经通过调用指南页面的信息获取到调用的server端地址，但是调用发起方的客户端访问该地址不通，出现无法连接、域名无法解析的现象。原因分析在调用指南页签中显示的调用地址都是华为云APIG（API网关服务）的地址。调用发起方的客户端和华为云网络不通。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
导入模型提示该账号受限或者没有操作权限 - AI开发平台ModelArts

导入模型提示该账号受限或者没有操作权限问题现象在导入AI应用时，提示用户账号受限。原因分析提示用户账号受限，常见原因有如下几种：导入模型账号欠费导致被冻结；导入模型账号没有对应工作空间的权限；导入模型账号为子账号，主账号没有给子账号赋予模型相关权限。权限说明请参见：策略及授权项说明；

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

# PFA算子是否使用高精度模式；默认值为0表示不开启。针对Qwen2-7B模型和Qwen2-57b模型，必须开启此配置，否则精度会异常；其他模型不建议开启，因为性能会有损失。若要开启图模式，请配置以下4个环境变量，并且启动服务时不要添加enforce-eager参数。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

当使用自定义镜像部署推理服务时，要确认镜像是否满足自定义镜像规范，否则无法成功完成推理服务的部署。部署推理服务登录AI Gallery。单击“模型”进入模型列表。选择需要部署为推理服务的模型，单击模型名称进入模型详情页。在模型详情页，选择“部署 > 推理服务”进入部署推理服务页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
导入AI应用对于镜像大小的限制 - AI开发平台ModelArts

间不会造成额外费用增加。如果使用的是OBS导入或者训练导入，则包含基础镜像、模型文件、代码、数据文件和下载安装软件包的大小总和。如果使用的是自定义镜像导入，则包含解压后镜像和镜像下载文件的大小总和。父主题：导入模型

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型
在线服务处于运行中状态时，如何填写推理请求的request header和request body - AI开发平台ModelArts

t header和request body 问题现象部署在线服务完成且在线服务处于“运行中”状态时，通过ModelArts console的调用指南tab页签可以获取到推理请求的地址，但是不知道如何填写推理请求的header及body。原因分析在线服务部署完成且服务处于运行

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

--max-cpu-loras要求配置和--max-loras相同。发请求时model指定为lora1或者lora2即为LoRA推理。 --quantization：推理量化参数。当使用量化功能，则在推理服务启动脚本中增加该参数，如果未使用量化功能，则无需配置。根据使用的量化方式配置，可选择awq

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

单击模型名称，进入模型详情页面，查看模型详情信息。部署服务并查看详情在模型详情页面，单击右上角“部署>在线服务”，进入服务部署页面，模型和版本默认选中，选择合适的“实例规格”（例如CPU：2核 8GB），其他参数可保持默认值，单击“下一步”，跳转至服务列表页，当服务状态变为“运行中”，服务部署成功。单击服务名

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
模型管理 - AI开发平台ModelArts
模型管理 - AI开发平台ModelArts

模型管理导入模型父主题： Standard推理部署

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

ModelArts全球基础设施围绕华为云区域和可用区构建。华为云区域提供多个在物理上独立且隔离的可用区，这些可用区通过延迟低、吞吐量高且冗余性高的网络连接在一起。利用可用区，您可以设计和操作在可用区之间无中断地自动实现故障转移的应用程序和数据库。与传统的单个或多个数据中心基础设施相比

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
查看ModelArts模型详情 - AI开发平台ModelArts

模型的创建时间。描述模型的描述。操作部署：将模型发布为在线服务、批量服务或边缘服务。创建新版本：创建新的模型版本。参数配置除版本外，将默认选择上一个版本的配置信息，您可以对参数配置进行修改。删除：删除对应的模型。说明：如果模型的版本已经部署服务，需先删除关联的服务后再执行删除操作。模型删除后不可恢复，请谨慎操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
管理同步在线服务 - AI开发平台ModelArts

查看在线服务详情查看在线服务的事件管理在线服务生命周期修改在线服务配置在云监控平台查看在线服务性能指标集成在线服务API至生产环境中应用设置在线服务故障自动重启父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
服务预测失败 - AI开发平台ModelArts

服务预测失败问题现象在线服务部署完成且服务已经处于“运行中”的状态，向服务发起推理请求，预测失败。原因分析及处理方法服务预测需要经过客户端、外部网络、APIG、Dispatch、模型服务多个环节。每个环节出现都会导致服务预测失败。图1 推理服务流程图出现APIG.XX

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
查看在线服务的事件 - AI开发平台ModelArts

查看在线服务的事件服务的（从用户可看见部署服务任务开始）整个生命周期中，每一个关键事件点在系统后台均有记录，用户可随时在对应服务的详情页面进行查看。方便用户更清楚的了解服务部署和运行过程，遇到任务异常时，更加准确的排查定位问题。可查看的事件点包括：表1 事件事件类型事件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
创建模型不同方式的场景介绍 - AI开发平台ModelArts

创建模型不同方式的场景介绍 AI开发和调优往往需要大量的迭代和调试，数据集、训练代码或参数的变化都可能会影响模型的质量，如不能统一管理开发流程元数据，可能会出现无法重现最优模型的现象。 ModelArts的模型可导入所有训练生成的元模型、上传至对象存储服务（OBS）中的元模型和容器镜像中的元模型，可对所有迭代和调试的模型进行统一管理。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
查看批量服务的事件 - AI开发平台ModelArts

查看批量服务的事件服务的（从用户可看见部署服务任务开始）整个生命周期中，每一个关键事件点在系统后台均有记录，用户可随时在对应服务的详情页面进行查看。方便用户更清楚的了解服务部署和运行过程，遇到任务异常时，更加准确的排查定位问题。可查看的事件点包括：表1 事件事件类型事件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

ModelArts推理默认使用公网访问在线服务。在线服务部署成功后，将为用户提供一个可调用的API，此API为标准Restful API。您可以在服务详情页面，调用指南页签中查看API接口公网地址。图1 API接口公网地址约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
在线服务运行中但是预测失败时，如何排查报错是不是模型原因导致的 - AI开发平台ModelArts

在线服务运行中但是预测失败时，如何排查报错是不是模型原因导致的问题现象在线服务启动后，当在线服务进入到“运行中”状态后，进行预测，预测请求发出后，收到的响应不符合预期，无法判断是不是模型的问题导致的不符合预期。原因分析在线服务启动后，ModelArts提供两种方式的预测：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
查看在线服务详情 - AI开发平台ModelArts

修改服务个性化配置服务个性化配置规则由配置条件、访问版本、自定义运行参数（包括配置项名称和配置项值）组成。您可以为在线服务的不同版本设定不同配置条件，并支持携带自定义运行参数。个性化配置规则的优先级与顺序相对应，从高到低设置。您可以通过拖动个性化配置规则的顺序更换优先级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务

总条数： 1490

上一页
1
...
7
8
9
...
75
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

访问在线服务支持的认证方式 - AI开发平台ModelArts

作为调用发起方的客户端无法访问已经获取到的推理请求地址 - AI开发平台ModelArts

导入模型提示该账号受限或者没有操作权限 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

导入AI应用对于镜像大小的限制 - AI开发平台ModelArts

在线服务处于运行中状态时，如何填写推理请求的request header和request body - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

模型管理 - AI开发平台ModelArts

故障恢复 - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

管理同步在线服务 - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

创建模型不同方式的场景介绍 - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

在线服务运行中但是预测失败时，如何排查报错是不是模型原因导致的 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线