检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
说明: 子网掩码必须要覆盖IP网段,即子网掩码和IP地址转换为二进制后,IP地址最后的0个数一定要比子网掩码的最后为0的个数多。 更改类型 选择集群路由的更改类型。 “添加”:新增路由 “删除”:删除路由 图1 配置集群路由 单击“确定”完成集群路由配置。
上下文长度(K) NLP大模型在进行一次特定的推理时可以考虑的最大令牌数。可以扩展上下文以生成更全面的响应。 部署ID 模型的部署id信息。 认证类型 IAM认证:支持华为iam认证,系统将默认使用css资源租户进行认证。
512 rerank_url 是 String rerank模型的调用url 最小长度:1 最大长度:512 表6 NlpConfig 参数 是否必选 参数类型 描述 context_length 是 Integer 上下文长度,即NLP大模型在进行一次特定的推理时可以考虑的最大令牌数
上下文长度(K) NLP大模型在进行一次特定的推理时可以考虑的最大令牌数。可以扩展上下文以生成更全面的响应。 认证类型 勾选“自定义认证”,添加自定义请求头。
1 最大长度:512 rerank_url String rerank模型的调用url 最小长度:1 最大长度:512 表8 NlpConfig 参数 参数类型 描述 context_length Integer 上下文长度,即NLP大模型在进行一次特定的推理时可以考虑的最大令牌数
512 rerank_url 是 String rerank模型的调用url 最小长度:1 最大长度:512 表7 NlpConfig 参数 是否必选 参数类型 描述 context_length 是 Integer 上下文长度,即NLP大模型在进行一次特定的推理时可以考虑的最大令牌数