AI开发平台MODELARTS-部署预测分析服务:模型部署

时间:2024-11-21 19:46:00

模型部署

模型部署操作即将模型部署为在线服务,并且提供在线的测试UI与监控能力。完成模型训练后,可选择准确率理想且训练状态为“运行成功”的版本部署上线。具体操作步骤如下。

  1. “运行节点”页面中,待训练状态变为“等待输入”,双击“服务部署”节点,完成相关参数配置。
  2. 在服务部署页面,选择模型部署使用的资源规格。
    • 模型来源:默认为生成的模型。
    • 选择模型及版本:自动匹配当前使用的模型版本,支持选择版本。
    • 资源池:默认公共资源池。
    • 分流:默认为100,输入值必须是0-100之间。
    • 计算节点规格:请根据界面显示的列表,选择可用的规格,置灰的规格表示当前环境无法使用。如果公共资源池下规格为空数据,表示当前环境无公共资源。建议使用专属资源池,或者联系系统管理员创建公共资源池。
    • 计算节点个数:默认为1,输入值必须是1-5之间的整数。
    • 是否自动停止:启用该参数并设置时间后,服务将在指定时间后自动停止。如果不启用此参数,在线服务将一直运行,同时一直收费,自动停止功能可以帮您避免产生不必要的费用。默认开启自动停止功能,且默认值为“1小时后”

      目前支持设置为“1小时后”“2小时后”“4小时后”“6小时后”“自定义”。如果选择“自定义”的模式,可在右侧输入框中输入1~24范围内的任意整数。

      如果您购买了套餐包,计算节点规格可选择您的套餐包,同时在“配置费用”页签还可查看您的套餐包余量以及超出部分的计费方式,请您务必关注,避免造成不必要的资源浪费。

  3. 完成资源配置后,单击“继续运行”,在弹框中确认继续运行后,服务部署节点将继续运行,直至状态变为“运行成功”,至此,已将模型部署为在线服务。
support.huaweicloud.com/usermanual-standard-modelarts/exeml-modelarts_0019.html