检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过API使用KooSearch实现搜索问答 KooSearch服务提供的API支持发布到不同的环境,发布成功后支持被调用。 场景描述 KooSearch服务开通成功后,会自动创建KooSearch API。在KooSearch服务详情页的API管理页签,可以看到知识管理和文档解析两类API。
引用定位:针对回答结果定位到原文位置。 图文结合:展示原文引用关联图片。 知识库缓存:如果打开知识库缓存按钮,您的搜索效率会相对高效。使用知识库缓存需要选择以下几个参数。 缓存生成模型服务:选择一个模型服务。 缓存阈值:达到缓存阈值,就会使用缓存输入值必须在0.1到1之间。 缓存策略:
智能问答版:提供内置大语言模型(LLM),一站式快速搭建企业级RAG服务。 本案例选择“智能问答版”。 实例名称 - 实例名称为Flexus企业搜索服务的名称。 实例名称在4位到16位之间,必须以字母开头,可以包含字母、数字、中划线或者下划线,不能包含其他的特殊字符。 本案例以“kos_ocr”为例。 OCR增强 -
可前往云搜索服务控制台对集群进行管理。 API管理:KooSearch服务开通成功后,会自动创建KooSearch API,将API发布到不同环境后,支持在环境中调用API使用KooSearch服务。 日志管理:为了方便用户使用日志定位问题,KooSearch服务提供了日志查询
effective_input_length 否 Integer 效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2 最大值:128 top_p 否 Float 通过限制词汇的选择来控制生
effective_input_length 否 Integer 效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2 最大值:128 top_p 否 Float 通过限制词汇的选择来控制生
effective_input_length Integer 效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2 最大值:128 top_p Float 通过限制词汇的选择来控制生成文
effective_input_length Integer 效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2 最大值:128 top_p Float 通过限制词汇的选择来控制生成文
请求的API(Application programming interface)管理方式。 API方式 如果用户需要将公有云平台上的集成到第三方系统,用于二次开发,请使用API方式访问,具体操作请参见《Flexus企业搜索服务API参考》。 控制台方式 其他相关操作,请使用管理
管理知识库。 使用KooSearch的API实现搜索文档 您也可以使用调用API的方式实现搜索问答,KooSearch服务提供的API支持发布到不同的环境,发布成功后支持被调用,具体操作如下: 配置API网关。 发布KooSearch API。 调用已发布的KooSearch API。
实例名称为Flexus KooSearch文档问答生成的实例名。系统会自动生成一个名称,如果您不想用自动生成的,也可以自己编辑。 实例名称在4位到16位之间,必须以字母开头,可以包含字母、数字、中划线或者下划线,不能包含其他的特殊字符。 OCR增强 - OCR增强功能是引用OCR服务能力,来增强实例的搜索和问答能力。
"id": "xxxxxxxxxxxxxxxxxx" //项目ID } } } } 到这里为止这个请求需要的内容就具备齐全了,您可以使用curl、Postman或直接编写代码等方式发送请求调用API。对于“获取用户Token”