检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参数 参数类型 描述 question_id String 问题ID 最小长度:1 最大长度:64 chat_id String 会话ID 最小长度:1 最大长度:64 question String 问题 最小长度:1 最大长度:65535 answer String 答案 最小长度:1
请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 接口鉴权使用的Token,Token获取方式参考:获取IAM用户Token 最小长度:1 最大长度:1000000 表2 请求Body参数 参数 是否必选 参数类型 描述 chat_ids 是 Array
通过NET网关打通网络,使Koosearch支持智能文档解析能力,对PDF/Word等格式的文档内容进行版式分析,智能识别文档中的各种版式类型,如表格、图片、公式、标题等,以及识别单栏、双栏版面结构及段落顺序,对用户上传的文档进行智能解析。本文介绍Flexus企业搜索服务如何配置OCR增强实现文档智能解析功能。
将本地文件上传至KooSearch知识库 创建完知识库,需要在知识库中上传知识数据。 场景描述 KooSearch知识库支持上传以下几种类型的知识。 表1 上传数据 上传方式 描述 上传文档 支持上传文档类型的知识,支持格式为 .doc, .docx, .pdf, .pptx, .ppt, .xlsx, .xls
子网掩码必须要覆盖IP网段,即子网掩码和IP地址转换为二进制后,IP地址最后的0个数一定要比子网掩码的最后为0的个数多。 更改类型 选择集群路由的更改类型。 “添加”:新增路由 “删除”:删除路由 图1 配置集群路由 单击“确定”完成集群路由配置。 单击“集群路由”后面的“查看”
附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 详细的公共请求消息头字段请参见表 公共请求消息头。 表2 公共请求消息头 参数 是否必选 描述 Content-Type 是 消息体的类型(格式)。推荐用户使用默认值application/json。
服务器等待请求时发生超时。 客户端可以随时再次提交该请求而无需进行任何更改。 409 Conflict 服务器在完成请求时发生冲突。 返回该状态码,表明客户端尝试创建的资源已经存在,或者由于冲突请求的更新操作不能被完成。 410 Gone 客户端请求的资源已经不存在。 返回该状态码,表明请求的资源已被删除。
在新建模型服务页面。根据下表填写对应参数后,单击“确定”按钮。 表1 新建模型服务 参数 说明 模型服务名称 输入模型服务名称,不能为空。 模型类型 NLP模型-云底座:通过华为云提供的盘古nlp大模型访问方式。 NLP模型-昇腾云:通过昇腾云的MAAS服务提供的nlp大模型访问方式。
l API设计规范的自研接口。通过Koosearch的自研接口,您可以使用Koosearch的表1 接口说明所示的功能。 表1 接口说明 类型 说明 知识库管理接口 知识库管理等相关接口。 结构化数据接口 将结构化数据文件纳入系统进行管理接口。 文件管理接口 用户纳入系统的文档管理接口。
表3 添加SNAT规则 参数 说明 使用场景 选择“虚拟私有云”。 网段 选择“使用已有”,选择和KooSearch同一个VPC。 公网IP类型 选择“弹性公网IP”,勾选满足要求的IP。 如果没有可选的弹性公网IP,可以单击“查看弹性公网IP”跳转到弹性公网IP列表页,申请弹性公网IP。
KOS.00010005 url路径不合法 url路径不合法。 参考文档进行url路径修改。 400 KOS.00010006 参数类型异常 参数类型异常。 根据具体提示信息修改参数。 400 KOS.00020001 es查询异常 es查询异常。 建议检查es节点状态。 400 KOS
us企业搜索服务局点在贵阳一,终端节点见表1。 表1 Flexus企业搜索服务终端节点 区域名称 区域 终端节点(Endpoint) 协议类型 西南-贵阳一 cn-southwest-2 css.cn-southwest-2.myhuaweicloud.com HTTPS 基本概念
“层级分段”页签中有此按钮,可以自己设置开关。“自动分段”和“长度分段”页签中没有此按钮,跨标题合并使用的是系统默认参数,等于true。 表4 规则解析默认规则示例 类别 规则 描述 第一章 第一节 第一条 ^第([零〇一二三四五六七八九十百千万1-9]{1,7})章 ^第([零〇一二三四五六七八九十百千万1-9]{1
doc> [${doc?counter}]网页标题:${doc.title!}|||网页时间${doc.timestamp!}|||网页类别:无|||网页内容:${doc.content!} </#list> 用户:${query} 说明: 其中query和docs表示变量,
Flexus企业搜索服务开箱即用,帮助企业客户快速构建企业级RAG解决方案。 多模态知识入库 智能文档解析 用于文档内容解析,支持PDF、JPG、DOC、TXT、XLS、PPT等文档格式,通过OCR增强功能准确识别图片、表格等各式版面布局。 文档切分 支持多种拆分方式:自动拆分、层次拆分、长度拆分和自定义规则拆分。