数智融合计算服务-在试验场进行推理:约束与限制

时间:2024-12-31 15:49:36

约束与限制

使用公共推理服务时的通用约束限制如下:

  • Token配额约束:每种公共推理服务都有免费配额限制,超过配额不可用,也无法再购买。每种公共推理服务的配额为当前用户在当前局点下所有工作空间共享;
  • 时间约束:有效期为服务开通90天内,超过时间则失效。同一个推理服务在不同工作空间下面开通,以首次开通为准。
  • 不同的模型有不同的上下文长度约束,请见表公共推理服务
  • 不保证SLA,如果想要更高的性能,建议创建自己的推理服务进行推理;
support.huaweicloud.com/usermanual-fabric/dataartsfabric_02_0028.html