AI开发平台MODELARTS-更新管理:ModelArts在线服务更新

时间:2024-08-30 09:04:27

ModelArts在线服务更新

对于已部署的推理服务,ModelArts支持通过更换AI应用的版本号,实现服务升级。

推理服务有三种升级模式:全量升级、滚动升级(扩实例)和滚动升级(缩实例)。了解三种升级模式的流程,请参见图1

  • 全量升级

    需要额外的双倍的资源,先全量创建新版本实例,然后再下线旧版本实例。

  • 滚动升级(扩实例)

    需额外消耗部分实例资源用于滚动升级,扩实例越大,升级速度越快。

  • 滚动升级(缩实例)

    通过腾出部分实例资源用于滚动升级,缩实例数越大,升级速度越快,造成业务中断可能性越大。

图1 推理服务升级流程

推理服务更新升级的具体操作请参见升级服务

support.huaweicloud.com/productdesc-modelarts/modelarts_01_0038.html