搜索_华为云

请求超时返回Timeout - AI开发平台ModelArts

请求超时返回Timeout 问题现象服务预测请求超时原因分析请求超时，大概率是APIG（API网关）拦截问题。需排查APIG（API网关）和模型。处理方法优先排查APIG（API网关）是否是通的，可以在本地使用curl命令排查，命令行：curl -kv {预测地址}。如

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

部分，并将请求方法写在一起。这是因为URI-scheme都是HTTPS，而Endpoint在同一个区域也相同，所以简洁起见将这两部分省略。请求方法 HTTP请求方法（也称为操作或动词），它告诉服务你正在请求什么类型的操作。表2 HTTP方法方法说明 GET 请求服务器返回指定资源。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

12MB时，请求会被拦截。如果是从ModelArts console的预测页签进行的预测，由于console的网络链路的不同，此时要求请求体的大小不超过8MB。因此，尽量避免请求体大小超限。如果有高并发的大流量推理请求，请提工单联系专业服务支持。父主题： Standard推理部署

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
Method Not Allowed - AI开发平台ModelArts

服务预测报错：Method Not Allowed 原因分析服务预测默认注册的API需要使用POST方法调用。如您使用了GET方法，APIG（API网关）将会拦截请求。处理方法使用POST方法调用。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
出现“save error”错误，可以运行代码，但是无法保存 - AI开发平台ModelArts

如果当前Notebook还可以运行代码，但是无法保存，保存时会提示“save error”错误。大多数原因是华为云WAF安全拦截导致的。当前页面，即用户的输入或者代码运行的输出有一些字符被华为云拦截，认为有安全风险。出现此问题时，请提交工单，联系专业的工程师帮您核对并处理问题。父主题：实例故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
返回结果 - AI开发平台ModelArts
返回结果 - AI开发平台ModelArts

返回结果请求发送以后，您会收到响应，包含：状态码、响应消息头和响应消息体。状态码状态码是一组从1xx到5xx的数字代码，状态码表示了请求响应的状态，完整的状态码列表请参见状态码。对于获取用户Token接口，如果调用后返回状态码为“201”，则表示请求成功。响应消息头对

 帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

图1 VPC直连的高速访问通道示意图约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。准备工作使用专属资源池部署在线服务，服务状态为“运行中”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

0201 请求体内容过大请求体内容过大时，APIG（API网关）会拦截请求，报错“APIG.0201”:“Request entity too large”。请减少预测请求内容后重试。当使用API调用地址预测时，请求体的大小限制是12MB，超过12MB时，请求会被拦截。使用ModelArts

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。 SSE在线服务调用 SSE协议本身不提供额外的认证方式，和HTTP请求方式一致。可以使用ModelArts提供的以下认证方式：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
服务预测失败 - AI开发平台ModelArts

常见问题请参见服务预测失败，报错APIG.XXXX。其他被APIG（API网关）拦截的场景： Method Not Allowed 请求超时返回Timeout 出现ModelArts.XXXX类型的报错，表示请求在Dispatcher出现问题而被拦截。常见报错：在线服务预测报错ModelArts.4302

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

在自己的VPC节点中访问在线服务。约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。操作步骤 VPC访问通道访问在线服务操作步骤如下：获取ModelArts终端节点服务地址

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

网地址。图1 API接口公网地址约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。访问在线服务公网访问在线服务有以下认证方式，API调用请参见认证详情：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
部署的在线服务状态为告警 - AI开发平台ModelArts

查，并重新部署。后台预测请求过多。如果您使用API接口进行预测，请检查是否预测请求过多。大量的预测请求会导致部署的在线服务进入告警状态。业务内存不正常。请检查推理代码是否存在内存溢出或者内存泄漏的问题。模型运行异常。请检查您的模型是否能正常运行。例如模型依赖的资源是否故障，需要排查推理日志。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

12M以上的请求请使用Token认证。 AK/SK认证就是使用AK/SK对请求进行签名，在请求时将签名信息添加到消息头，从而通过身份认证。 AK(Access Key ID)：访问密钥ID。与私有访问密钥关联的唯一标识符；访问密钥ID和私有访问密钥一起使用，对请求进行加密签名。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

图1 VPC直连的高速访问通道示意图约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。准备工作使用专属资源池部署在线服务，服务状态为“运行中”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
在线服务预测报错ModelArts.4206 - AI开发平台ModelArts

在线服务部署完成且服务已经处于“运行中”的状态，向服务发起推理请求，报错“ModelArts.4206”。原因分析 ModelArts.4206表示该API的请求流量超过了设定值。为了保证服务的平稳运行，ModelArts对单个API的推理请求流量做了限制，同时为了保证推理服务可以稳定运行在

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
重置节点后无法正常使用？ - AI开发平台ModelArts

重置节点后无法正常使用？问题现象当ModelArts Lite的CCE集群在资源池上只有一个节点，且用户设置了volcano为默认调度器时，在ModelArts侧进行重置节点的操作后，节点无法正常使用，节点上的POD会调度失败。原因分析在ModelArts侧进行节点重置后

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
将模型部署为批量推理服务 - AI开发平台ModelArts

数据已完成准备：已在ModelArts中创建状态“正常”可用的模型。准备好需要批量处理的数据，并上传至OBS目录。已在OBS创建至少1个空的文件夹，用于存储输出的内容。背景信息用户最多可创建1000个批量服务。根据模型定义的输入请求不同（JSON文本或文件），不同的模型输入，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
PD分离部署使用说明 - AI开发平台ModelArts

大模型推理是自回归的过程，有以下两阶段： Prefill阶段（全量推理）将用户请求的prompt传入大模型，进行计算，中间结果写入KVCache并推出第1个token，属于计算密集型。 Decode阶段（增量推理）将请求的前1个token传入大模型，从显存读取前文产生的KVCache再进行计算，属于访存密集型。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 分离部署
PD分离部署使用说明 - AI开发平台ModelArts

大模型推理是自回归的过程，有以下两阶段： Prefill阶段（全量推理）将用户请求的prompt传入大模型，进行计算，中间结果写入KVCache并推出第1个token，属于计算密集型。 Decode阶段（增量推理）将请求的前1个token传入大模型，从显存读取前文产生的KVCache再进行计算，属于访存密集型。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署

总条数： 710

上一页
1
2
3
4
5
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

请求超时返回Timeout - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

Method Not Allowed - AI开发平台ModelArts

出现“save error”错误，可以运行代码，但是无法保存 - AI开发平台ModelArts

返回结果 - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

部署的在线服务状态为告警 - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

在线服务预测报错ModelArts.4206 - AI开发平台ModelArts

重置节点后无法正常使用？ - AI开发平台ModelArts

将模型部署为批量推理服务 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线