AI开发平台MODELARTS-从对象存储服务（OBS）中选择元模型:创建AI应用操作步骤

时间：2024-04-30 16:18:22

AI开发平台MODELARTS 创建AI应用

创建AI应用操作步骤

登录ModelArts管理控制台，在左侧导航栏中选择“AI应用”，进入AI应用列表页面。
单击左上角的“创建”，进入“创建AI应用”页面。

在“创建AI应用”页面，填写相关参数。

填写AI应用基本信息，详细参数说明请参见表1。

表1 AI应用基本信息参数说明
参数名称	说明
名称	AI应用名称。支持1～64位可见字符（含中文），名称可以包含字母、中文、数字、中划线、下划线。
版本	设置所创建AI应用的版本。第一次导入时，默认为0.0.1。说明： AI应用创建完成后，可以通过创建新版本，导入不同的元模型进行调优。
描述	AI应用的简要描述。

填写元模型来源及其相关参数。当“元模型来源”选择“从对象存储服务（OBS）中选择”时，其相关的参数配置请参见表2。

针对从OBS导入的元模型，ModelArts要求根据模型包规范，编写推理代码和配置文件，并将推理代码和配置文件放置元模型存储的“model”文件夹下。如果您选择的目录下不符合模型包规范，将无法创建AI应用。

图1 从OBS中选择元模型
点击放大

表2 元模型来源参数说明
参数	说明
“选择元模型”	选择元模型存储的OBS路径。 OBS路径不能含有空格，否则创建AI应用会失败。
“AI引擎”	根据您选择的元模型存储路径，将自动关联出元模型使用的“AI引擎”。如果“AI引擎”是Custom引擎时，需要配置容器调用接口，用于指定模型启动的协议和端口号。固定请求协议是HTTPS，端口号为8080。
“健康检查”	用于指定模型的健康检查。选择了“AI引擎”和“运行环境”后，部分支持健康检查的引擎会显示该参数。使用Custom引擎时，需要在镜像中配置健康检查接口，否则会导致服务部署失败。检查方式：可以选择“HTTP请求检查”或者“执行命令检查”。使用Custom引擎时，支持选择“HTTP请求检查”或者“执行命令检查”。使用非Custom引擎时，仅支持选择“HTTP请求检查”。健康检查URL：“检查方式”选择“HTTP请求检查”时显示，填写健康检查的URL，默认值为“/health”。健康检查命令：“检查方式”选择“执行命令检查”时显示，填写健康检查的命令。健康检查周期：填写1-2147483647之前的整数，单位为秒。延迟时间（秒）：实例启动后，延迟执行健康检查的时间。填写0-2147483647之间的整数，单位为秒，不能为空。健康检查最大失败次数：填写1-2147483647之间的整数。在服务启动阶段，当健康检查请求连续失败达到所填次数后，服务会进入异常状态；在服务运行阶段，当健康检查请求连续失败达到所填次数后，服务会进入告警状态。说明：使用Custom引擎时需要符合自定义引擎规范，请参见使用自定义引擎创建AI应用。当AI应用配置了健康检查，部署的服务在收到停止指令后，会延后3分钟才停止。
“动态加载”	用于实现快速部署和快速更新模型。若勾选“动态加载”，则模型文件和运行时依赖仅在实际部署时拉取。单个模型文件大小超过5GB，需要配置“动态加载”。
“运行时依赖”	罗列选中模型对环境的依赖。例如依赖“tensorflow”，安装方式为“pip”，其版本必须为1.8.0及以上版本。
“AI应用说明”	为了帮助其他AI应用开发者更好的理解及使用您的AI应用，建议您提供AI应用的说明文档。单击“添加AI应用说明”，设置“文档名称”及其“URL”。AI应用说明支持增加3条。
“配置文件”	系统默认关联您存储在OBS中的配置文件。打开开关，您可以直接在当前界面查看或编辑模型配置文件。说明：该功能即将下线，后续请根据“AI引擎”、“运行时依赖”和“apis定义”修改模型的配置信息。
“部署类型”	选择此AI应用支持部署服务的类型，部署上线时只支持部署为此处选择的部署类型，例如此处只选择在线服务，那您导入后只能部署为在线服务。当前支持“在线服务”、“批量服务”和“边缘服务”。
“apis定义”	提供AI应用对外Restfull api数据定义，用于定义AI应用的输入、输出格式。apis定义填写规范请参见模型配置文件编写说明中的apis参数说明，示例代码请参见apis参数代码示例。