检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文件抽取配置项 tags Array of strings 文档标签,可以使用标签对文档进行自动分组,用于筛选过滤。 注意事项: 1.建议不区分大小写,例如, Approved and approved 是同一个标签 2.文档可以有一个或多个标签 3.建议格式为:标签名称:标签值 ,
category 否 String 文档目录,单值,对应目录树中的叶子节点。 建议格式为 叶子节点目录名称(目录 ID),如:专利(3166-1)。 最小长度:0 最大长度:255 tags 否 Array of strings 文档标签,可以使用标签对文档进行自动分组,用于筛选过滤。 注意事项:
删除文档接口 功能介绍 删除指定ID的文件。 URI DELETE /v1/koosearch/repos/{repo_id}/files/{file_id} 表1 路径参数 参数 是否必选 参数类型 描述 repo_id 是 String 知识库ID,1~64个字符,只能包含数字、字母、中划线和下划线。
上传结构化数据 功能介绍 将结构化数据文件上传到对象存储服务OBS中进行结构化数据批处理功能。 URI POST /v1/koosearch/repos/{repo_id}/structured-data 表1 路径参数 参数 是否必选 参数类型 描述 repo_id 是 String
KooSearch服务开箱即用,帮助企业客户快速构建企业级RAG解决方案。 多模态知识入库 智能文档解析 用于文档内容解析,支持PDF、JPG、DOC、TXT、XLS、PPT等文档格式,通过OCR增强功能准确识别图片、表格等各式版面布局。 文档切分 支持多种拆分方式:自动拆分、层次拆分、长度拆分和自定义规则拆分。
华为云企业搜索KooSearch是基于华为云的云搜索服务搭建的一站式智能搜索解决方案,帮助企业聚焦业务场景和应用开发,场景服务化、技术简单化、低门槛化,满足开发者基于业务场景的二次开发。在RAG(Retrieval-Augmented Generation)及搜索场景提供效果和性能突出的
用户的文档解析规则定义 创建用户解析规则 修改用户解析规则 列举用户规则列表 删除用户定义规则解析接口
选择“文档管理”页签,单击“上传”。 在上传对话框中单击“选择文档”,本地选择已提前准备好的文档。重复的文档不允许上传。 图2 上传文档 单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”为“正常”,说明文档已上传成功。 选择知识库。 在KooSearch控制台,左侧导航栏选择“体验平台”,进入体验平台页面。
选择“文档管理”页签,单击“上传”。 在上传对话框中单击“选择文档”,本地选择已提前准备好的文档。重复的文档不允许上传。 图3 上传文档 单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”为“正常”,说明文档已上传成功。 文档上传成功后,可以单击文档名称,查看切片效果。
"1777619994213965826" } 状态码 状态码 描述 200 创建成功 400 请求体参数错误 500 内部异常 错误码 请参见错误码。 父主题: 用户的文档解析规则定义
"1777619994213965826" } 状态码 状态码 描述 200 修改请求 400 请求体参数错误 500 内部异常 错误码 请参见错误码。 父主题: 用户的文档解析规则定义
"1777619994213965826" } 状态码 状态码 描述 200 删除成功 400 请求体参数错误 500 内部异常 错误码 请参见错误码。 父主题: 用户的文档解析规则定义
es批量创建索引异常。 建议检查es节点状态。 400 KOS.00020008 es删除文档异常 es删除文档异常。 建议检查es节点状态。 400 KOS.00020009 es更新文档异常 es更新文档异常。 建议检查es节点状态。 400 KOS.00020010 es批量操作异常
] } 状态码 状态码 描述 200 用户定义规则列表 400 请求体参数错误 500 内部异常 错误码 请参见错误码。 父主题: 用户的文档解析规则定义
API。在KooSearch服务详情页的API管理页签,可以看到知识管理和文档解析两类API。 知识管理:该类API主要用于知识库管理,例如上传文档、刷新文档等。 文档解析:该类API主要用于对文档数据进行处理,例如切分文档内容。 将KooSearch API发布到不同环境后,支持在环境中
根据知识库ID获取当前知识库下的所有文件list,包括文档名称、文档类型、文档大小、文档状态、创建人、创建时间等。 删除知识库 根据ID删除知识库。 表3 结构化数据接口 API 说明 结构化数据上传 将结构化数据文件上传到对象存储服务OBS中进行结构化数据批处理功能。 下载失败的条目
层级分段 参数 说明 层级解析模式 自动解析:按照系统规则自动解析。 规则解析: 由于不同文档的层次结构多样且不一致,针对不同的文档可自定义其文档层次解析规则,更好地解析切分文档从而提升基于文档知识问答的准确率。 自定义默认规则 将最常见的规则,作为默认规则可选,详情请参见提供的默认规则示例。
进入“文档管理”页面。 图1 进入文档管理页面 默认进入“文档管理”页签,单击“上传”。 在上传对话框中单击“选择文档”,本地选择已提前准备好的文档。重复的文档不允许上传。 图2 上传文档 单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”为“正常”,说明文档已上传成功。
云搜索服务 CSS 基本功能介绍 14:01 快速使用云搜索服务 特性讲解 Flexus企业搜索服务 KooSearch文档问答 05:22 了解什么是KooSearch文档问答 云搜索服务 CSS Elasticsearch增强能力 07:15 了解CSS的Elasticsearch增强能力
查看Flexus企业搜索服务详情 在服务的基本信息页面,可以获取服务的内网访问文档解析地址、内网访问知识管理地址、计费模式等信息。除此之外,还能进行管理服务、API管理和日志管理。 管理服务:KooSearch文档问答服务针对已创建的服务所配置的集群,可前往云搜索服务控制台对集群进行管理。