检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
搜索结构化数据文件 功能介绍 根据文件名搜索目标文件。 URI GET /v1/koosearch/repos/{repo_id}/structured-data/search 表1 路径参数 参数 是否必选 参数类型 描述 repo_id 是 String 知识库ID,1~64个字符,只能包含数字、字母、中划线和下划线。
将结构化数据文件上传到对象存储服务OBS中进行结构化数据批处理功能。 URI POST /v1/koosearch/repos/{repo_id}/structured-data 表1 路径参数 参数 是否必选 参数类型 描述 repo_id 是 String 知识库ID,1~64个字符,只能包含数字、字母、中划线和下划线。
缺省值:0 search_temperature 否 Float 搜索增强场景用于控制生成文本的多样性和创造力。 取值接近0表示最低的随机性,1表示最高的随机性。一般来说,temperature越低,适合完成确定性的任务。temperature越高,例如0.9,适合完成创造性的任务。
模型生成最大新词数 最小值:1 最大值:131072 缺省值:131072 chat_temperature Float 非搜索增强模型生成多样性 最小值:0 最大值:1 search_temperature Float 搜索增强模型生成多样性 最小值:0 最大值:1 缺省值:0.3 presence_penalty
模型生成最大新词数 最小值:1 最大值:131072 缺省值:131072 chat_temperature Float 非搜索增强模型生成多样性 最小值:0 最大值:1 search_temperature Float 搜索增强模型生成多样性 最小值:0 最大值:1 缺省值:0.3 presence_penalty
最大新词数不超过512。 非搜索增强模型生成多样性(temperature) 控制非搜索增强模型文本的随机性,值越高,文本随机性越、多样性和创造性越高。默认值为0.8。 搜索增强模型生成多样性(temperature) 控制搜索增强模型文本的随机性,值越高,文本随机性越、多样性和创造性越高。默认值为0
Model)模型 内置基于RAG场景下SFT(Supervised Fine-tuning)优化后的检索增强大模型,支持对接盘古NLP(Natural Language Processing)大模型,支持对接昇腾云开源大模型。 智能解析切分 通过OCR(Optical Character
模型生成最大新词数 最小值:1 最大值:131072 缺省值:131072 chat_temperature 否 Float 非搜索增强模型生成多样性 最小值:0 最大值:1 search_temperature 否 Float 搜索增强模型生成多样性 最小值:0 最大值:1 缺省值:0.3 presence_penalty
模型生成最大新词数 最小值:1 最大值:131072 缺省值:131072 chat_temperature 否 Float 非搜索增强模型生成多样性 最小值:0 最大值:1 search_temperature 否 Float 搜索增强模型生成多样性 最小值:0 最大值:1 缺省值:0.3 presence_penalty
算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该
引用知识库 版本管理 您创建成功知识库的时候,系统会自动创建一个知识库初始版本,对版本的一些管理操作如下所示: 进入KooSearch控制台。 左侧导航栏选择“知识库管理”,进入“知识库管理”页面。 单击“版本管理”页签。 您创建好知识库后,系统会默认创建一个初始版本,如下图所示。 如
接口说明所示的功能。 表1 接口说明 类型 说明 知识库管理接口 知识库管理等相关接口。 结构化数据接口 将结构化数据文件纳入系统进行管理接口。 文件管理接口 用户纳入系统的文档管理接口。 FAQ管理接口 用户自定义的FAQ相关管理接口。 FAQ批量管理接口 用户自定义的批量FAQ相关管理接口。
未勾选,解析结果中不包含目录页。 勾选后,解析结果中包含目录页。 拆分设置:即分段设置,选择分段方式。 表2 拆分设置 参数 说明 自动分段 系统根据文档特点自动选择合适的分段方式。 长度分段 默认按照段落进行拆分合并,如果段落过长则通过标识符进行分段。 分段标识符:分段方式为遇到所