搜索_华为云

实时推理的部署及使用流程 - AI开发平台ModelArts

可调用的API，此API为标准Restful API。通过VPC高速访问通道的方式访问在线服务：使用VPC直连的高速访问通道，用户的业务请求不需要经过推理平台，而是直接经VPC对等连接发送到实例处理，访问速度更快。在线服务的API默认为HTTPS访问，同时还支持以下的传输协议：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
注册自定义镜像 - AI开发平台ModelArts

TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。 services 否 Array of strings 镜像支持的服务，默认值NOTEBOOK、SSH。枚举值如下: NOTEBOOK：镜像支持通过https协议访问Notebook。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

使用ModelArts console的预测页签进行的预测，由于console的网络链路的不同，要求请求体的大小不超过8MB。图2 请求报错APIG.0201 APIG.0301 鉴权失败通过API进行服务预测，或者使用Token进行APP认证，需要获取正确的Token鉴权，当Token

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在线服务预测报错MR.0105 - AI开发平台ModelArts

请在“在线服务”详情页面的日志页签中查看对应的报错日志，分析报错原因。图2 报错日志从上图报错日志判断，预测失败是模型推理代码编写有问题。解决方法根据日志报错提示，append方法中缺少必填参数，修改模型推理代码文件“customize_service.py”中的代码，给append方法中传入合理的参数。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
基本配置 - AI开发平台ModelArts
基本配置 - AI开发平台ModelArts

基本配置权限配置创建网络专属资源池VPC打通 ECS服务器挂载SFS Turbo存储在ECS中创建ma-user和ma-group obsutil安装和配置（可选）工作空间配置父主题：专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
什么是ModelArts - AI开发平台ModelArts

Standard 面向AI开发者的一站式开发平台，提供了简洁易用的管理控制台，包含自动学习、数据管理、开发环境、模型训练、模型管理、部署上线等端到端的AI开发工具链，实现AI全流程生命周期管理。面向有AI开发平台诉求的用户。 ModelArts MaaS 提供端到端的大模型生产工具链和昇

 帮助中心 > AI开发平台ModelArts > 产品介绍
更新Notebook实例 - AI开发平台ModelArts

Code）或SSH客户端，通过SSH远程接入Notebook实例时需要的相关配置。 flavor 否 String 支持变更实例规格，支持变更的规格可以通过本章节的查询支持可切换规格列表的API获取。 image_id 否 String 支持更新镜像ID，镜像ID参考查询支持的镜像列表获取。 name 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
ModelArts中提示OBS相关错误 - AI开发平台ModelArts

在区域。比对您创建的OBS桶所在区域与ModelArts所在区域是否一致。务必保证OBS桶与ModelArts所在区域一致。检查您的账号是否有该OBS桶的访问权限如果在使用Notebook时，需要访问其他账号的OBS桶，请查看您的账号是否有该OBS桶的访问权限。如没有权限，

帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
Lite Server算力资源和镜像版本配套关系 - AI开发平台ModelArts

Server算力资源和镜像版本配套关系 Lite Server提供多种NPU、GPU镜像，您可在购买前了解当前支持的镜像及对应详情。 NPU Snt9裸金属服务器支持的镜像详情镜像名称：ModelArts-Euler2.8_Aarch64_Snt9_C78 表1 镜像详情软件类型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
访问在线服务支持的认证方式 - AI开发平台ModelArts

访问在线服务支持的认证方式通过Token认证的方式访问在线服务通过AK/SK认证的方式访问在线服务通过APP认证的方式访问在线服务父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
部署的在线服务状态为告警 - AI开发平台ModelArts

请检查推理代码是否存在内存溢出或者内存泄漏的问题。模型运行异常。请检查您的模型是否能正常运行。例如模型依赖的资源是否故障，需要排查推理日志。实例pod数量异常。如果您曾经找过运维人员删除过异常的实例pod，事件中可能会出现告警“服务异常，不正常的实例数为XXX”。在出现这种告警后，服务会自动拉起新的正常实

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
修改模型服务QPS - AI开发平台ModelArts

在“模型部署”页面，单击“我的服务”页签。在目标模型服务右侧，单击操作列的“更多 > 设置QPS”，在弹窗中修改数值，单击“提交”启动修改任务。图1 修改QPS 在“我的服务”页签，单击服务名称，进入服务详情页，可以查看修改后的QPS是否生效。父主题：管理我的服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
权限配置 - AI开发平台ModelArts
权限配置 - AI开发平台ModelArts

Turbo的所有权限。使用SFS服务时需要配置。 ECS弹性云服务器弹性云服务器所有权限。使用ECS服务时需要配置。 SWR容器镜像仓库容器镜像仓库所有权限。使用SWR服务时需要配置。同时，还需开通SWR组织权限。 VPC虚拟私有云子用户在创建ModelArts的专属资源池

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
访问在线服务支持的访问通道 - AI开发平台ModelArts

访问在线服务支持的访问通道通过公网访问通道的方式访问在线服务通过VPC访问通道的方式访问在线服务通过VPC高速访问通道的方式访问在线服务父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
访问在线服务支持的传输协议 - AI开发平台ModelArts

访问在线服务支持的传输协议使用WebSocket协议的方式访问在线服务使用Server-Sent Events协议的方式访问在线服务父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
查询支持的服务部署规格 - AI开发平台ModelArts

GpuInfo object 规格的GPU信息。 npu_info NpuInfo object 规格的NPU信息。 source_type String 此规格应用于模型的类型，取值为空或auto，默认为空，代表是用户自己产生的模型；取值为auto时，代表是自动学习训练的模型，计费方式有差别。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用MaaS部署模型服务 - AI开发平台ModelArts

选择“我的服务”页签。选择待删除的服务，单击操作列的“更多 > 删除”，在弹窗中输入“DELETE”，单击“确定”，删除服务。单实例QPS的推荐值说明单实例流量限制QPS和请求的输入输出有关，表2中的QPS推荐值是在多轮对话、摘要生产和信息检索场景下预估出的数据，仅供参

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
模型的自定义镜像制作流程 - AI开发平台ModelArts

模型包，新的镜像超过35G，在服务器（如ECS）上制作。具体案例参考在ECS中通过Dockerfile从0制作自定义镜像用于推理。图3 模型的自定义镜像制作场景三约束限制自定义镜像中不能包含恶意代码。创建模型的自定义镜像大小不超过50GB。对于同步请求模式的模型，如果预

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
部署模型为在线服务 - AI开发平台ModelArts

使用所选规格部署服务时，会产生必要的系统消耗，因此服务实际占用的资源会略大于该规格。 “实例数” 设置当前版本模型的实例个数。如果实例数设置为1，表示后台的计算模式是单机模式；如果实例数设置大于1，表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 “环境变量” 设置环境变量，注入环境

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
在ModelArts的Notebook中使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

run”之前运行。语句中的“logits”，表示根据不同网络中分类层权重的变量名，配置不同的参数。此处填写其对应的关键字。 mox.set_flag('checkpoint_exclude_patterns', 'logits') 如果使用的是MoXing内置网络，其对应的关键字需使用如下

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook

总条数： 1639

上一页
1
...
14
15
16
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

实时推理的部署及使用流程 - AI开发平台ModelArts

注册自定义镜像 - AI开发平台ModelArts

服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

在线服务预测报错MR.0105 - AI开发平台ModelArts

基本配置 - AI开发平台ModelArts

什么是ModelArts - AI开发平台ModelArts

更新Notebook实例 - AI开发平台ModelArts

ModelArts中提示OBS相关错误 - AI开发平台ModelArts

Lite Server算力资源和镜像版本配套关系 - AI开发平台ModelArts

访问在线服务支持的认证方式 - AI开发平台ModelArts

部署的在线服务状态为告警 - AI开发平台ModelArts

修改模型服务QPS - AI开发平台ModelArts

权限配置 - AI开发平台ModelArts

访问在线服务支持的访问通道 - AI开发平台ModelArts

访问在线服务支持的传输协议 - AI开发平台ModelArts

查询支持的服务部署规格 - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

在ModelArts的Notebook中使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线