检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
上传图片 功能介绍 上传图片入库。 URI POST /v1/koosearch/image/{img_id} 表1 路径参数 参数 是否必选 参数类型 描述 img_id 是 String 图片ID,格式为img-[0-9a-z]{32} 最小长度:1 最大长度:64 请求参数
图片管理 上传图片 获取图片内容
获取图片内容 功能介绍 根据ID获取图片内容。 URI GET /v1/koosearch/image/{img_id} 表1 路径参数 参数 是否必选 参数类型 描述 img_id 是 String 图片ID,格式为img-[0-9a-z]{32} 最小长度:1 最大长度:64
选择“文档管理”页签,单击“上传”。 在上传对话框中单击“选择文档”,本地选择已提前准备好的文档。重复的文档不允许上传。 图3 上传文档 单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”为“正常”,说明文档已上传成功。 文档上传成功后,可以单击文档名称,查看切片效果。
category 否 String 文档目录,单值,对应目录树中的叶子节点。 建议格式为 叶子节点目录名称(目录 ID),如:专利(3166-1)。 最小长度:0 最大长度:255 tags 否 Array of strings 文档标签,可以使用标签对文档进行自动分组,用于筛选过滤。 注意事项:
选择“文档管理”页签,单击“上传”。 在上传对话框中单击“选择文档”,本地选择已提前准备好的文档。重复的文档不允许上传。 图2 上传文档 单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”为“正常”,说明文档已上传成功。 选择知识库。 在KooSearch控制台,左侧导航栏选择“体验平台”,进入体验平台页面。
文件抽取配置项 tags Array of strings 文档标签,可以使用标签对文档进行自动分组,用于筛选过滤。 注意事项: 1.建议不区分大小写,例如, Approved and approved 是同一个标签 2.文档可以有一个或多个标签 3.建议格式为:标签名称:标签值 ,
删除文档接口 功能介绍 删除指定ID的文件。 URI DELETE /v1/koosearch/repos/{repo_id}/files/{file_id} 表1 路径参数 参数 是否必选 参数类型 描述 repo_id 是 String 知识库ID,1~64个字符,只能包含数字、字母、中划线和下划线。
进入“文档管理”页面。 图1 进入文档管理页面 默认进入“文档管理”页签,单击“上传”。 在上传对话框中单击“选择文档”,本地选择已提前准备好的文档。重复的文档不允许上传。 图2 上传文档 单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”为“正常”,说明文档已上传成功。
文件抽取配置项 tags Array of strings 文档标签,可以使用标签对文档进行自动分组,用于筛选过滤。 注意事项: 1.建议不区分大小写,例如, Approved and approved 是同一个标签 2.文档可以有一个或多个标签 3.建议格式为:标签名称:标签值 ,
用户的文档解析规则定义 创建用户解析规则 修改用户解析规则 列举用户规则列表 删除用户定义规则解析接口
文件抽取配置项 tags Array of strings 文档标签,可以使用标签对文档进行自动分组,用于筛选过滤。 注意事项: 1.建议不区分大小写,例如, Approved and approved 是同一个标签 2.文档可以有一个或多个标签 3.建议格式为:标签名称:标签值 ,
Flexus企业搜索服务开箱即用,帮助企业客户快速构建企业级RAG解决方案。 多模态知识入库 智能文档解析 用于文档内容解析,支持PDF、JPG、DOC、TXT、XLS、PPT等文档格式,通过OCR增强功能准确识别图片、表格等各式版面布局。 文档切分 支持多种拆分方式:自动拆分、层次拆分、长度拆分和自定义规则拆分。
根据指定ID,删除对应的对话历史。 批量删除对话历史 根据多个ID,批量删除对话历史信息。 表9 图片管理接口 API 说明 上传图片 上传图片入库。 获取图片内容 根据ID获取图片内容。 表10 模型管理接口 API 说明 新增模型 新增配置模型,包括模型名称、模型描述、模型endpoint、模型配置。
解析设置:是否使用OCR增强、是否需要解析图片、是否需要解析页眉页脚、是否需要解析目录页 文档拆分设置:自动分段、长度分段(按文本长度分段)、层级分段(按小标题分段,可自定义小标题解析规则) 搜索模型设置:rerank模型配置 NLP模型设置:生成模型选择 其他设置:召回数量、精排开关、参考文档数量、意图分类、Query改写开关
说明 OCR增强 勾选后,即可调用OCR服务进行智能文档识别,如表格解析或扫描文件等。 解析图片 未勾选,在文档中遇到图片默认跳过,不处理图片。 勾选后,有两种解析方式可供选择: 提取图片文本:识别图片内文字。 仅保留原图:将图片提取后上传OBS桶,便于问答图文展示。 解析页眉页脚
query_rewrite_enabled Boolean 改写开关 reference_count Integer 参考文档数量。参考文档指最终和query一起输入给NLP模型,用于生成最终答案的文档 最小值:1 最大值:10 fields Array of KnowledgeRepoFieldSchema
FileExtractConf 参数 是否必选 参数类型 描述 parse_conf 否 ParseConf object 文档解析配置,包含是否使用OCR增强、是否解析图片、解析图片是否需要提取文字、是否解析页眉页脚、是否解析目录页 split_conf 否 SplitConf object
"1777619994213965826" } 状态码 状态码 描述 200 创建成功 400 请求体参数错误 500 内部异常 错误码 请参见错误码。 父主题: 用户的文档解析规则定义
query_rewrite_enabled Boolean 改写开关 reference_count Integer 参考文档数量。参考文档指最终和query一起输入给NLP模型,用于生成最终答案的文档 最小值:1 最大值:10 fields Array of KnowledgeRepoFieldSchema