检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
将本地文件上传至KooSearch知识库 创建完知识库,需要在知识库中上传知识数据。 场景描述 KooSearch知识库支持上传以下几种类型的知识。 表1 上传数据 上传方式 描述 上传文档 支持上传文档类型的知识,支持格式为 .doc, .docx, .pdf, .pptx,
ture) 控制非搜索增强模型文本的随机性,值越高,文本随机性越、多样性和创造性越高。默认值为0.8。 搜索增强模型生成多样性(temperature) 控制搜索增强模型文本的随机性,值越高,文本随机性越、多样性和创造性越高。默认值为0.3。 文本重复度(presence_penalty)
“相关性阈值”:超过相关度阈值的搜索结果才能在搜索结果页展示,否则会被过滤。 单击“确定”。 体验搜索 在“体验平台”页面右上角单击“搜索”,切换至搜索体验。 在输入框中输入问题,单击,查看搜索结果。 图1 体验搜索 选中搜索结果,可查看更详细的内容。单击“阅读全文”,可查看文档原文。 当前针对上传的多栏
String 问答刷新标志(0-否,1-是) 最小长度:1 最大长度:1 max_tokens 否 Integer 生成文本的最大token数量。 输入的文本加上生成的文本总量不能超过模型所能处理的最大长度。 最小值:1 最小值:1 最大值:131072 缺省值:2048 stream
创建用户解析规则 功能介绍 用于创建用户自定义的解析规则,解析规则用于解析需要作为subtitle的文本,规则由上而下依次校验。 URI POST /v1/koosearch/rule-regex 请求参数 表1 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
oad file 响应示例 状态码: 200 上传文档接口响应体 { "file_id" : "60fa0fbf-a809-4e4e-8d26-ec389a497bf4" } 状态码 状态码 描述 200 上传文档接口响应体 400 参数错误 500 内部异常 错误码 请参见错误码。
选择使用AppCode认证方式调用部署好的模型服务,具体操作请参见调用MaaS部署的模型服务。 获取并记录模型服务的“调用模型名称”、“API接口公网地址”和“AppCode”,当KooSearch对接MaaS时会使用到这些参数。 步骤2:开通Flexus企业搜索服务 购买智能问答版
务。 Embedding模型服务:基于盘古大模型技术的文本表示模型,将文本转化为用数值表示的向量形式,用于文本检索、聚类、推荐等场景。 精排模型服务:基于盘古大模型技术的文本表示模型,将文本转化为用数值表示的向量形式,用于文本检索、聚类、推荐等场景,语义搜索场景下,加入了精排模型,提升搜索的效果。
在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”。 进入文档管理页面。 单击页面右上角的“删除”,确认需要删除的知识库信息,在输入框输入要删除的知识库名称后,单击“确认”,删除知识库。 父主题: 在控制台使用KooSearch实现搜索问答
用户的文档解析规则定义 创建用户解析规则 修改用户解析规则 列举用户规则列表 删除用户定义规则解析接口
考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2 最大值:128 top_p 否 Float 通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。 最小值:0.1 最大值:1 缺省值:0.1 max_tokens 否 Integer 模型生成最大新词数 最小值:1
考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2 最大值:128 top_p 否 Float 通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。 最小值:0.1 最大值:1 缺省值:0.1 max_tokens 否 Integer 模型生成最大新词数 最小值:1
利用缓存技术,预先存储频繁请求的信息,系统从缓存中快速提供,节省时间和资源。 搜索大模型 文本向量模型 支持将文本转化为用数值表示的向量形式用于语义检索。 文本精排模型 可更加精准找到相关文本,不同于向量模型输出向量,直接计算query和doc的相关性更加准确,可用于对向量召回结果的重新排序。
考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2 最大值:128 top_p Float 通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。 最小值:0.1 最大值:1 缺省值:0.1 max_tokens Integer 模型生成最大新词数 最小值:1
文件管理接口 用户纳入系统的文档管理接口。 FAQ管理接口 用户自定义的FAQ相关管理接口。 FAQ批量管理接口 用户自定义的批量FAQ相关管理接口。 搜索与问答接口 Koosearch的搜索与模型问答接口。 对话历史接口 用户对话历史接口。 图片管理接口 图片管理相关接口。 模型管理接口
最小长度:1 最大长度:65535 content String 文本内容 最小长度:1 最大长度:65535 big_content String 内容上下文,比如未分片的原始表格。 注意: (1)搜索接口可能有值 (2)问答接口会将big_content替换到content,此字段清空
考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2 最大值:128 top_p Float 通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。 最小值:0.1 最大值:1 缺省值:0.1 max_tokens Integer 模型生成最大新词数 最小值:1
大新词数不超过512。 NLP模型-裸机:通过裸机部署提供的盘古nlp大模型访问方式。 搜索Embedding模型:搜索向量化模型,支持将文本转化成向量。 搜索精排模型:对搜索的召回结果进行重排序,提升向量检索的效果。 搜索规划模型:提供多轮改写及意图识别功能。 缓存生成模型:提
catalog_enabled Boolean 解析目录页 缺省值:false image_conf String 图片解析开启后(TEXT 提取图片文本、IMAGE 保留原图) 缺省值:TEXT 枚举值: TEXT IMAGE 表8 SplitConf 参数 参数类型 描述 split_mode
最小长度:1 最大长度:64 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 接口鉴权使用的Token,Token获取方式参考:获取IAM用户Token 最小长度:1 最大长度:1000000 响应参数 无 请求示例 无