检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
简单化、低门槛化,满足开发者基于业务场景的二次开发。在RAG(Retrieval-Augmented Generation)及搜索场景提供效果和性能突出的组件化服务,架构理想、灵活编排的机制,帮助企业客户快速构建RAG以及搜索服务。 仅“西南-贵阳一”区域支持开通和使用KooSearch服务。
trieval-Augmented Generation)及搜索场景提供效果和性能突出的组件化服务,架构理想、灵活编排的机制,帮助企业客户快速构建RAG以及搜索服务。 什么是Flexus企业搜索 基于业界效果突出的搜索模型、云搜索服务的高性能GaussDB向量数据库以及LLM模型
删除用户定义规则解析接口 功能介绍 用于删除用户自定义解析规则。 URI DELETE /v1/koosearch/rule-regex/{id} 表1 路径参数 参数 是否必选 参数类型 描述 id 是 String 用户规则ID 最小长度:1 最大长度:64 请求参数 表2 请求Header参数
IAM认证:支持华为iam认证,系统将默认使用css资源租户进行认证。开启使用委托账号后可以通过配置委托名和委托账号的方式使用委托账号的权限进行认证。 自定义认证:支持在调用时添加自定义请求头。 URL 向量模型的调用url,不同的模型有不同的url,url可以从独享集群处获取。 创建成功后 ,可以在模型管理页面中看到创建的模型服务。
创建用户解析规则 功能介绍 用于创建用户自定义的解析规则,解析规则用于解析需要作为subtitle的文本,规则由上而下依次校验。 URI POST /v1/koosearch/rule-regex 请求参数 表1 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
解析设置:是否使用OCR增强、是否需要解析图片、是否需要解析页眉页脚、是否需要解析目录页 文档拆分设置:自动分段、长度分段(按文本长度分段)、层级分段(按小标题分段,可自定义小标题解析规则) 搜索模型设置:rerank模型配置 NLP模型设置:生成模型选择 其他设置:召回数量、精排开关、参考文档数量、意图分类、Query改写开关
析需要自定义层级规。 层级分段详情如表3所示。 表3 层级分段 参数 说明 层级解析模式 自动解析:按照系统规则自动解析。 规则解析: 由于不同文档的层次结构多样且不一致,针对不同的文档可自定义其文档层次解析规则,更好地解析切分文档从而提升基于文档知识问答的准确率。 自定义默认规则
结构化数据接口 将结构化数据文件纳入系统进行管理接口。 文件管理接口 用户纳入系统的文档管理接口。 FAQ管理接口 用户自定义的FAQ相关管理接口。 FAQ批量管理接口 用户自定义的批量FAQ相关管理接口。 搜索与问答接口 Koosearch的搜索与模型问答接口。 对话历史接口 用户对话历史接口。
回答。 搜索增强自定义prompt 使用场景:主要用于RAG场景下的模型生成阶段。(RAG场景:对话生成任务中,使用检索步骤来增强生成模型的能力。) 组成要素:检索出的参考文档、用户问题、任务指令以及其他要求。 使用方式:支持自定义prompt,如果未配置自定义prompt,则使
单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”为“正常”,说明文档已上传成功。 文档上传成功后,可以单击文档名称,查看切片效果。 图3 单击文档名称 图4 切片效果 管理文档数据。 单击操作列的“下载”,可下载文档至本地。 单击操作列的“删除”,可删除已上传的文档。 单击操作列的“Q
参数类型 描述 id String 规则ID 最小长度:1 最大长度:65535 rule_regexs Array of strings 用户自定义规则内容 最小长度:1 最大长度:65535 数组长度:1 - 65535 状态码: 400 表4 响应Body参数 参数 参数类型 描述
操作权限委托给更专业、高效的其他账号,被委托的账号可以根据权限代替您进行资源运维工作。可以选择默认委托和自定义委托。 默认委托:选择系统自带的默认委托。 自定义委托:选择自定义委托的话,需要先创建委托 。通过创建委托,可以将资源共享给其他账号,或委托更专业的人或团队来代为管理资源
上下文长度(K) NLP大模型在进行一次特定的推理时可以考虑的最大令牌数。可以扩展上下文以生成更全面的响应。 认证类型 勾选“自定义认证”,添加自定义请求头。“标头键”填写“X-Apig-AppCode”,“标头值”填写MaaS服务中模型服务的“AppCode”,获取方式请参见步骤1:在MaaS部署模型服务。
模型endpoint 最小长度:1 最大长度:512 extend_config 否 ModelExtendConfig object 模型的自定义配置,json格式 alias 否 String 昇腾模型场景请求模型需要的name 最小长度:1 最大长度:32 表4 ModelExtendConfig
query2query rerank search_plan llm extend_config 是 ModelExtendConfig object 模型的自定义配置,json格式 alias 否 String 昇腾模型场景请求模型需要的name 最小长度:1 最大长度:32 表3 ModelExtendConfig
是否扩展长上下文。提供更广泛的上下文,以生成完整回答。 缺省值:false effective_input_length 否 Integer 效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2
是否扩展长上下文。提供更广泛的上下文,以生成完整回答。 缺省值:false effective_input_length Integer 效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2
是否扩展长上下文。提供更广泛的上下文,以生成完整回答。 缺省值:false effective_input_length Integer 效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2
单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”为“正常”,说明文档已上传成功。 文档上传成功后,可以单击文档名称,查看切片效果。