云服务器内容精选

  • 查看公共推理服务 推理端点试用期内,可以直接使用公共推理服务进行推理。目前的公共推理服务是基于开源大模型部署的,列表如下(实际的推理服务以服务为准): 表1 公共推理服务 名称 描述 免费额度 最大上下文长度 prompt模板长度 最大输出token QWEN_2_72B Qwen2在包括 语言理解 、生成、多语言能力、编码、数学和推理在内的多个基准测试中,超越了大多数以前的开放权重模型,与专有模型表现出竞争力。该模型参数规模为720亿。 公测期间提供100万token免费配额,超过配额不可用,也没办法再购买;有效期为服务开通90天内,超过时间则失效。 16k 23 16360 父主题: 用公共推理服务进行推理