数智融合计算服务-查看公共推理服务
查看公共推理服务
推理端点试用期内,可以直接使用公共推理服务进行推理。目前的公共推理服务是基于开源大模型部署的,列表如下(实际的推理服务以服务为准):
名称 |
描述 |
免费额度 |
最大上下文长度 |
prompt模板长度 |
最大输出token |
---|---|---|---|---|---|
QWEN_2_72B |
Qwen2在包括 语言理解 、生成、多语言能力、编码、数学和推理在内的多个基准测试中,超越了大多数以前的开放权重模型,与专有模型表现出竞争力。该模型参数规模为720亿。 |
公测期间提供100万token免费配额,超过配额不可用,也没办法再购买;有效期为服务开通90天内,超过时间则失效。 |
16k |
23 |
16360 |