检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
搜索规划 利用LLM技术的Query分类、多轮改写、复杂查询分解。 图文并茂&内容溯源 支持输出参考链接,和上下文语义相关的图片。 内容优选 通过query和片段的语义关系,精简出和query相关的web片段,达到减少下游大模型推理成本,以及提升大模型的推理效果。 缓存 利用缓存
集群使用子网实现与其他网络的隔离,并独享所有网络资源,以提高网络安全。 选择当前虚拟私有云下集群需要的子网。支持选择共享VPC下的子网。 安全组 安全组起着虚拟防火墙的作用,为集群提供安全的网络访问控制策略。 选择集群需要的安全组,单击“查看安全组”跳转到安全组列表,可以了解安全组详情。 购买时长 - 支持按月购买,
管理知识库。 使用KooSearch的API实现搜索文档 您也可以使用调用API的方式实现搜索问答,KooSearch服务提供的API支持发布到不同的环境,发布成功后支持被调用,具体操作如下: 配置API网关。 发布KooSearch API。 调用已发布的KooSearch API。 编辑API。
pig请求地址} 服务接口请求地址获取方式: 账号登录CSS控制台。 左侧导航栏选择:“KooSearch >Flexus 企业搜索服务”。 根据“名称/ID”,单击进入已购买的服务。 单击“API管理”,即可看到支持的所有API列表。 单击展开箭头,即可查看每个API详情,包括
选择一个发布策略,通过策略的方式,为API提供灵活的控制策略和扩展能力。 分组 选择一个分组,API分组相当于API的集合,API提供者以API分组为单位,管理分组内的所有API。 说明: API分组发布后不可修改,请谨慎选择。 配置委托 通过委托信任功能,您可以将自己账号中的资源操作权限委
认项目为单位进行授权,用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制,可以在区域默认的项目中创建子项目,并在子项目中购买资源,然后以子项目为单位进行授权,使得用户仅能访问特定子项目中资源,使得资源的权限控制更加精确。 图1 项目隔离模型 Checkpoin
搜索增强场景用于控制生成文本的多样性和创造力。 取值接近0表示最低的随机性,1表示最高的随机性。一般来说,temperature越低,适合完成确定性的任务。temperature越高,例如0.9,适合完成创造性的任务。 最小值:0 最大值:1 缺省值:0.3 chat_temperature
是否扩展长上下文。提供更广泛的上下文,以生成完整回答。 缺省值:false effective_input_length 否 Integer 效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2
是否扩展长上下文。提供更广泛的上下文,以生成完整回答。 缺省值:false effective_input_length 否 Integer 效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2
是否扩展长上下文。提供更广泛的上下文,以生成完整回答。 缺省值:false effective_input_length Integer 效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2
是否扩展长上下文。提供更广泛的上下文,以生成完整回答。 缺省值:false effective_input_length Integer 效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2
API概览 Koosearch提供的接口为符合RESTful API设计规范的自研接口。通过Koosearch的自研接口,您可以使用Koosearch的表1 接口说明所示的功能。 表1 接口说明 类型 说明 知识库管理接口 知识库管理等相关接口。 结构化数据接口 将结构化数据文件纳入系统进行管理接口。
Token的有效期为24小时,需要使用同一个Token鉴权时,可以缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限。 T
线。 获取方式: 账号登录KooSearch体验平台,在左侧导航栏选择:"知识库管理" ,在此界面获取"知识库ID"字段的值,表示该知识库在向量数据库中存储的ID,具有唯一性 最小长度:1 最大长度:64 file_id 是 String 文件ID,1~64个字符,只能包含数字、字母、中划线和下划线。
在此界面获取"知识库ID"字段的值,表示该知识库在向量数据库中存储的ID,具有唯一性 最小长度:1 最大长度:64 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 接口鉴权使用的Token,Token获取方式参考:获取IAM用户Token
"你是一名问题回答助手,请参考以下给出的文章回答问题。在回答问题之前,请你先仔细判给出的文章是否可以回答问题。如果给出的文章与问题不相关,则直接输出“抱歉,我无法回答此次问题“;如果给出的文章与问题相关,则参考给出的文章回答问题。\n给出的文章:\n{0}\n问题:{1}\n请你
对于“获取用户Token”接口,您可以从接口的请求部分看到所需的请求参数及参数说明。将消息体加入后的请求如下所示,加粗的斜体字段需要根据实际值填写,其中username为用户名,********为用户的登录密码,domainname为用户所属的账号名称,如果是账号本身获取token,
返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应请求
击右上角的“联系我们”,反馈您所遇到的问题,技术支持会快速为您定位问题,解决问题。 400 KOS.00040002 调用多轮改写服务异常 调用多轮改写服务异常。 模型状态异常,请联系技术支持。您可以登录华为云官网,在华为云首页,单击右上角的“联系我们”,反馈您所遇到的问题,技术支持会快速为您定位问题,解决问题。
X-Auth-Token 是 String 接口鉴权使用的Token,Token获取方式参考:获取IAM用户Token 最小长度:1 最大长度:1000000 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 - File 下载成功的文件 状态码: 400 表4 响应Body参数