AI开发平台MODELARTS-扩缩容简介

时间:2023-12-29 18:18:21

扩缩容简介

ModelArts在线服务当前提供两种方式的扩缩容方式,手动扩缩容和自动扩缩容,应对用户多样化的需求。目前只支持对单个AI应用实例数进行修改。

  • 手动扩缩容:用户可以手动触发在线服务扩缩容,支持对单个AI应用的实例数量进行修改,减少修改实例数的耗时。
  • 自动扩缩容:用户可以设置弹性伸缩策略,根据设置的策略对实例数进行修改,提高资源利用率。手动扩缩容,用户可以设置合理的弹性伸缩策略,在高、低峰时间段自动对实例进行扩容或缩容的操作,进而提高资源的利用率。
    表1 手动扩缩容和自动扩缩容差异对比

    伸缩类型

    手动扩缩容

    自动扩缩容

    配置方式

    手动

    自动

    配置内容

    修改计算节点个数

    设置伸缩策略

    执行方式

    手动配置后执行

    定期触发或指标触发

    伸缩失败后的表现

    回滚到扩缩容之前的实例个数

    按实际扩缩的实例个数为准

support.huaweicloud.com/inference-modelarts/inference-modelarts-0100.html