搜索_华为云

在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

在线服务预测时，如何提高预测速度？部署在线服务时，您可以选择性能更好的“计算节点规格”提高预测速度。例如使用GPU资源代替CPU资源。部署在线服务时，您可以增加“计算节点个数”。如果节点个数设置为1，表示后台的计算模式是单机模式；如果节点个数设置大于1，表示后台的计算模式为分布式的。您可以根据实际需求进行选择。

帮助中心 > AI开发平台ModelArts > 常见问题 > 推理部署 > 部署上线 > 在线服务
部署在线服务 - AI开发平台ModelArts

部署在线服务部署在线服务包括：已部署为在线服务的初始化。部署在线服务predictor。部署批量服务transformer。部署服务返回服务对象Predictor，其属性包括服务管理章节下的所有功能。示例代码在ModelArts notebook平台，Session

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
WebSocket在线服务全流程开发 - AI开发平台ModelArts

加载模型，执行预处理，完成推理，拼装响应体等。操作步骤 WebSocket在线服务开发操作步骤如下：上传镜像至容器镜像服务使用镜像创建AI应用使用AI应用部署在线服务 WebSocket在线服务调用上传镜像至容器镜像服务将准备好的本地镜像上传到容器镜像服务（SWR）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 推理部署
专属资源池下的在线服务停止后，启动新的在线服务，提示资源不足 - AI开发平台ModelArts

专属资源池下的在线服务停止后，启动新的在线服务，提示资源不足停止在线服务后，需要等待几分钟等待资源释放。父主题：资源池

 帮助中心 > AI开发平台ModelArts > 常见问题 > 资源池
在线服务处于运行中状态时，如何填写推理请求的request header和request body - AI开发平台ModelArts

在线服务处于运行中状态时，如何填写推理请求的request header和request body 问题现象部署在线服务完成且在线服务处于“运行中”状态时，通过ModelArts console的调用指南tab页签可以获取到推理请求的地址，但是不知道如何填写推理请求的header及body。

帮助中心 > AI开发平台ModelArts > 常见问题 > 推理部署 > 部署上线 > 在线服务
工具使用 - AI开发平台ModelArts
工具使用 - AI开发平台ModelArts

设置知识库的本地路径。工具扫描结果解读 AI CPU算子分析和处理 MA-Advisor工具分析结果的html文件中会有下述链接，提供AI CPU算子相关问题的修复指导和案例。图14 AI CPU算子分析和处理亲和API替换 MA-Advisor工具分析结果的html文件中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 昇腾业务迁移 > 训练业务昇腾迁移通用指导 > PyTorch迁移性能调优 > 自动诊断工具MA-Advisor使用指导
部署在线服务时，自定义预测脚本python依赖包出现冲突，导致运行出错 - AI开发平台ModelArts

部署在线服务时，自定义预测脚本python依赖包出现冲突，导致运行出错导入模型时，需同时将对应的推理代码及配置文件放置在模型文件夹下。使用Python编码过程中，推荐采用相对导入方式（Python import）导入自定义包。如果ModelArts推理框架代码内部存在同名包，

帮助中心 > AI开发平台ModelArts > 常见问题 > 推理部署 > 部署上线 > 在线服务
在线服务鉴权 - AI开发平台ModelArts

在线服务鉴权功能介绍计费工作流在线服务鉴权。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/workflows/service/auth

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
从0-1制作自定义镜像并创建AI应用 - AI开发平台ModelArts

"application/json" } } ] 将AI应用部署为在线服务参考部署为在线服务将AI应用部署为在线服务。在线服务创建成功后，您可以在服务详情页查看服务详情。您可以通过“预测”页签访问在线服务。图5 访问在线服务父主题：使用自定义镜像创建AI应用（推理部署）

帮助中心 > AI开发平台ModelArts > 镜像管理 > 使用自定义镜像创建AI应用（推理部署）
本地IDE（SSH工具连接） - AI开发平台ModelArts

密钥对在用户第一次创建时，自动下载，之后使用相同的密钥时不会再有下载界面（用户一定要保存好），或者每次都使用新的密钥对。 Step1 安装SSH工具下载并安装SSH远程连接工具，以PuTTY为例，下载链接。 Step2 使用puttygen将密钥对.pem文件转成.ppk文件下载puttygen，并双击运行puttygen。

帮助中心 > AI开发平台ModelArts > 开发环境 > 本地IDE
kubectl工具配置 - AI开发平台ModelArts

链接信息使用kubectl工具。若通过内网使用kubectl工具，需要将kubectl工具安装在和集群在相同vpc下的某一台机器上。单击kubectl后的“配置”按钮。按照界面提示步骤操作即可。图4 通过内网使用kubectl工具通过公网使用kubectl工具，可以将kubectl安装在任一台可以访问公网的机器。

帮助中心 > AI开发平台ModelArts > ModelArts Lite用户指南 > 弹性集群k8s Cluster > k8s Cluster资源配置
创建在线服务包 - AI开发平台ModelArts

创建在线服务包功能介绍计费工作流购买资源。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/workfl

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
登录登出Gallery CLI配置工具 - AI开发平台ModelArts

登录登出Gallery CLI配置工具当Gallery CLI配置工具安装完成后，可以登录Gallery CLI上传或下载AI Gallery仓库的资产，使用完备后登出Gallery CLI清理缓存。登录Gallery CLI 在服务器执行如下命令登录Gallery CLI配置工具。 gallery-cli

帮助中心 > AI开发平台ModelArts > AI Gallery > AI Gallery（新版） > Gallery CLI配置工具指南
Gallery CLI配置工具介绍 - AI开发平台ModelArts

CLI配置工具：登录登出Gallery CLI配置工具。使用Gallery CLI配置工具：使用Gallery CLI配置工具下载文件。登出Gallery CLI配置工具：登录登出Gallery CLI配置工具。父主题： Gallery CLI配置工具指南

 帮助中心 > AI开发平台ModelArts > AI Gallery > AI Gallery（新版） > Gallery CLI配置工具指南
安装Gallery CLI配置工具 - AI开发平台ModelArts

在节点页签，单击选择“配置工具”，弹出该节点的配置工具页面。在配置工具页面，单击“下载”启动下载任务。当配置工具的状态记录中“工具状态”为“下载完成”时表示下载完成，工具包存放在“下载位置”的目录下。如果下载失败，单击“下载”可以重新下载。登录云服务器查看工具包是否下载成功。在

 帮助中心 > AI开发平台ModelArts > AI Gallery > AI Gallery（新版） > Gallery CLI配置工具指南
部署AI应用（在线服务） - AI开发平台ModelArts

部署AI应用（在线服务）部署为在线服务查看服务详情测试服务访问在线服务集成在线服务 CloudShell 父主题：部署AI应用（部署上线）

帮助中心 > AI开发平台ModelArts > 推理部署 > 部署AI应用（部署上线）
使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

使用Gallery CLI配置工具上传文件在服务器（ModelArts Lite云服务器或者是本地Windows/Linux等服务器）上登录Gallery CLI配置工具后，通过命令“gallery-cli upload”可以往AI Gallery仓库上传资产。命令说明登录Gallery

帮助中心 > AI开发平台ModelArts > AI Gallery > AI Gallery（新版） > Gallery CLI配置工具指南
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

https"} 部署在线服务使用的模型是从容器镜像中导入时，容器调用接口协议填写错误，会导致此错误信息。出于安全考虑，ModelArts提供的推理请求都是https请求，从容器镜像中选择导入模型时，ModelArts允许使用的镜像提供https或http服务，但必须在“容器调用接口”中明确

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
使用大模型创建AI应用部署在线服务 - AI开发平台ModelArts

使用大模型创建AI应用部署在线服务背景说明目前大模型的参数量已经达到千亿甚至万亿，随之大模型的体积也越来越大。千亿参数大模型的体积超过200G，在版本管理、生产部署上对平台系统产生了新的要求。例如：导入AI应用管理时，需要支持动态调整租户存储配额；模型加载、启动慢，部署时需要

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 推理部署
调整模型后，部署新版本AI应用能否保持原API接口不变？ - AI开发平台ModelArts

已存在部署完成的服务。已完成模型调整，创建AI应用新版本。操作步骤登录ModelArts管理控制台，在左侧导航栏中选择“部署上线 > 在线服务”，默认进入“在线服务”列表。在部署完成的目标服务中，单击操作列的“修改”，进入“修改服务”页面。在选择模型及配置中，单击“增加模型版本进行灰度发布”添加新版本。

帮助中心 > AI开发平台ModelArts > 常见问题 > 推理部署 > 部署上线 > 在线服务

总条数： 814

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

WebSocket在线服务全流程开发 - AI开发平台ModelArts

专属资源池下的在线服务停止后，启动新的在线服务，提示资源不足 - AI开发平台ModelArts

在线服务处于运行中状态时，如何填写推理请求的request header和request body - AI开发平台ModelArts

工具使用 - AI开发平台ModelArts

部署在线服务时，自定义预测脚本python依赖包出现冲突，导致运行出错 - AI开发平台ModelArts

在线服务鉴权 - AI开发平台ModelArts

从0-1制作自定义镜像并创建AI应用 - AI开发平台ModelArts

本地IDE（SSH工具连接） - AI开发平台ModelArts

kubectl工具配置 - AI开发平台ModelArts

创建在线服务包 - AI开发平台ModelArts

登录登出Gallery CLI配置工具 - AI开发平台ModelArts

Gallery CLI配置工具介绍 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

部署AI应用（在线服务） - AI开发平台ModelArts

使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

使用大模型创建AI应用部署在线服务 - AI开发平台ModelArts

调整模型后，部署新版本AI应用能否保持原API接口不变？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线