数智融合计算服务-查看公共推理服务

时间:2025-02-12 15:12:10

查看公共推理服务

推理端点试用期内,可以直接使用公共推理服务进行推理。目前的公共推理服务是基于开源大模型部署的,列表如下(实际的推理服务以服务为准):

表1 公共推理服务

名称

描述

免费额度

最大上下文长度

prompt模板长度

最大输出token

QWEN_2_72B

Qwen2在包括 语言理解 、生成、多语言能力、编码、数学和推理在内的多个基准测试中,超越了大多数以前的开放权重模型,与专有模型表现出竞争力。该模型参数规模为720亿。

公测期间提供100万token免费配额,超过配额不可用,也没办法再购买;有效期为服务开通90天内,超过时间则失效。

16k

23

16360

support.huaweicloud.com/usermanual-fabric/dataartsfabric_02_0027.html