-
在线服务预测时,如何提高预测速度? - AI开发平台ModelArts
在线服务预测时,如何提高预测速度? 部署在线服务时,您可以选择性能更好的“计算节点规格”提高预测速度。例如使用GPU资源代替CPU资源。 部署在线服务时,您可以增加“计算节点个数”。 如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。您可以根据实际需求进行选择。
-
部署在线服务 - AI开发平台ModelArts
部署在线服务 部署在线服务包括: 已部署为在线服务的初始化。 部署在线服务predictor。 部署批量服务transformer。 部署服务返回服务对象Predictor,其属性包括服务管理章节下的所有功能。 示例代码 在ModelArts notebook平台,Session
-
WebSocket在线服务全流程开发 - AI开发平台ModelArts
加载模型,执行预处理,完成推理,拼装响应体等。 操作步骤 WebSocket在线服务开发操作步骤如下: 上传镜像至容器镜像服务 使用镜像创建AI应用 使用AI应用部署在线服务 WebSocket在线服务调用 上传镜像至容器镜像服务 将准备好的本地镜像上传到容器镜像服务(SWR)
-
专属资源池下的在线服务停止后,启动新的在线服务,提示资源不足 - AI开发平台ModelArts
专属资源池下的在线服务停止后,启动新的在线服务,提示资源不足 停止在线服务后,需要等待几分钟等待资源释放。 父主题: 资源池
-
在线服务处于运行中状态时,如何填写推理请求的request header和request body - AI开发平台ModelArts
在线服务处于运行中状态时,如何填写推理请求的request header和request body 问题现象 部署在线服务完成且在线服务处于“运行中”状态时,通过ModelArts console的调用指南tab页签可以获取到推理请求的地址,但是不知道如何填写推理请求的header及body。
-
工具使用 - AI开发平台ModelArts
设置知识库的本地路径。 工具扫描结果解读 AI CPU算子分析和处理 MA-Advisor工具分析结果的html文件中会有下述链接,提供AI CPU算子相关问题的修复指导和案例。 图14 AI CPU算子分析和处理 亲和API替换 MA-Advisor工具分析结果的html文件中
-
部署在线服务时,自定义预测脚本python依赖包出现冲突,导致运行出错 - AI开发平台ModelArts
部署在线服务时,自定义预测脚本python依赖包出现冲突,导致运行出错 导入模型时,需同时将对应的推理代码及配置文件放置在模型文件夹下。使用Python编码过程中,推荐采用相对导入方式(Python import)导入自定义包。 如果ModelArts推理框架代码内部存在同名包,
-
在线服务鉴权 - AI开发平台ModelArts
在线服务鉴权 功能介绍 计费工作流在线服务鉴权。 接口约束 无 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/workflows/service/auth
-
从0-1制作自定义镜像并创建AI应用 - AI开发平台ModelArts
"application/json" } } ] 将AI应用部署为在线服务 参考部署为在线服务将AI应用部署为在线服务。 在线服务创建成功后,您可以在服务详情页查看服务详情。 您可以通过“预测”页签访问在线服务。 图5 访问在线服务 父主题: 使用自定义镜像创建AI应用(推理部署)
-
本地IDE(SSH工具连接) - AI开发平台ModelArts
密钥对在用户第一次创建时,自动下载,之后使用相同的密钥时不会再有下载界面(用户一定要保存好),或者每次都使用新的密钥对。 Step1 安装SSH工具 下载并安装SSH远程连接工具,以PuTTY为例,下载链接。 Step2 使用puttygen将密钥对.pem文件转成.ppk文件 下载puttygen,并双击运行puttygen。
-
kubectl工具配置 - AI开发平台ModelArts
链接信息 使用kubectl工具。 若通过内网使用kubectl工具,需要将kubectl工具安装在和集群在相同vpc下的某一台机器上。单击kubectl后的“配置”按钮。按照界面提示步骤操作即可。 图4 通过内网使用kubectl工具 通过公网使用kubectl工具,可以将kubectl安装在任一台可以访问公网的机器。
-
创建在线服务包 - AI开发平台ModelArts
创建在线服务包 功能介绍 计费工作流购买资源。 接口约束 无 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/workfl
-
登录登出Gallery CLI配置工具 - AI开发平台ModelArts
登录登出Gallery CLI配置工具 当Gallery CLI配置工具安装完成后,可以登录Gallery CLI上传或下载AI Gallery仓库的资产,使用完备后登出Gallery CLI清理缓存。 登录Gallery CLI 在服务器执行如下命令登录Gallery CLI配置工具。 gallery-cli
-
Gallery CLI配置工具介绍 - AI开发平台ModelArts
CLI配置工具:登录登出Gallery CLI配置工具。 使用Gallery CLI配置工具:使用Gallery CLI配置工具下载文件。 登出Gallery CLI配置工具:登录登出Gallery CLI配置工具。 父主题: Gallery CLI配置工具指南
-
安装Gallery CLI配置工具 - AI开发平台ModelArts
在节点页签,单击选择“配置工具”,弹出该节点的配置工具页面。 在配置工具页面,单击“下载”启动下载任务。当配置工具的状态记录中“工具状态”为“下载完成”时表示下载完成,工具包存放在“下载位置”的目录下。 如果下载失败,单击“下载”可以重新下载。 登录云服务器查看工具包是否下载成功。 在
-
部署AI应用(在线服务) - AI开发平台ModelArts
部署AI应用(在线服务) 部署为在线服务 查看服务详情 测试服务 访问在线服务 集成在线服务 CloudShell 父主题: 部署AI应用(部署上线)
-
使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts
使用Gallery CLI配置工具上传文件 在服务器(ModelArts Lite云服务器或者是本地Windows/Linux等服务器)上登录Gallery CLI配置工具后,通过命令“gallery-cli upload”可以往AI Gallery仓库上传资产。 命令说明 登录Gallery
-
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts
https"} 部署在线服务使用的模型是从容器镜像中导入时,容器调用接口协议填写错误,会导致此错误信息。 出于安全考虑,ModelArts提供的推理请求都是https请求,从容器镜像中选择导入模型时,ModelArts允许使用的镜像提供https或http服务,但必须在“容器调用接口”中明确
-
使用大模型创建AI应用部署在线服务 - AI开发平台ModelArts
使用大模型创建AI应用部署在线服务 背景说明 目前大模型的参数量已经达到千亿甚至万亿,随之大模型的体积也越来越大。千亿参数大模型的体积超过200G,在版本管理、生产部署上对平台系统产生了新的要求。例如:导入AI应用管理时,需要支持动态调整租户存储配额;模型加载、启动慢,部署时需要
-
调整模型后,部署新版本AI应用能否保持原API接口不变? - AI开发平台ModelArts
已存在部署完成的服务。 已完成模型调整,创建AI应用新版本。 操作步骤 登录ModelArts管理控制台,在左侧导航栏中选择“部署上线 > 在线服务”,默认进入“在线服务”列表。 在部署完成的目标服务中,单击操作列的“修改”,进入“修改服务”页面。 在选择模型及配置中,单击“增加模型版本进行灰度发布”添加新版本。