检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
作者开通了智能文档解析功能。 是,则进行下一步。 否,则单击操作列的“开通服务”为操作者开通智能文档解析功能。 如图1所示,表示所有人都已开通智能文档解析功能。 图1 开通智能文档解析 详细操作指导请参见文字识别OCR。 步骤2:开通Flexus企业搜索服务 购买智能问答版Fle
上传图片 功能介绍 上传图片入库。 URI POST /v1/koosearch/image/{img_id} 表1 路径参数 参数 是否必选 参数类型 描述 img_id 是 String 图片ID,格式为img-[0-9a-z]{32} 最小长度:1 最大长度:64 请求参数
获取图片内容 功能介绍 根据ID获取图片内容。 URI GET /v1/koosearch/image/{img_id} 表1 路径参数 参数 是否必选 参数类型 描述 img_id 是 String 图片ID,格式为img-[0-9a-z]{32} 最小长度:1 最大长度:64
catalog_enabled 否 Boolean 解析目录页 缺省值:false image_conf 否 String 图片解析开启后(TEXT 提取图片文本、IMAGE 保留原图) 缺省值:TEXT 枚举值: TEXT IMAGE 表6 SplitConf 参数 是否必选 参数类型 描述 split_mode
catalog_enabled 否 Boolean 解析目录页 缺省值:false image_conf 否 String 图片解析开启后(TEXT 提取图片文本、IMAGE 保留原图) 缺省值:TEXT 枚举值: TEXT IMAGE 表5 SplitConf 参数 是否必选 参数类型 描述 split_mode
String 图片解析开启后(TEXT 提取图片文本、IMAGE 保留原图) 缺省值:TEXT 枚举值: TEXT IMAGE 表8 SplitConf 参数 参数类型 描述 split_mode String 分段设置/层级解析模型 LENGTH-长度拆分,即为字数拆分 CATALOG-层级分段下的自动解析
String 图片解析开启后(TEXT 提取图片文本、IMAGE 保留原图) 缺省值:TEXT 枚举值: TEXT IMAGE 表8 SplitConf 参数 参数类型 描述 split_mode String 分段设置/层级解析模型 LENGTH-长度拆分,即为字数拆分 CATALOG-层级分段下的自动解析
String 图片解析开启后(TEXT 提取图片文本、IMAGE 保留原图) 缺省值:TEXT 枚举值: TEXT IMAGE 表8 SplitConf 参数 参数类型 描述 split_mode String 分段设置/层级解析模型 LENGTH-长度拆分,即为字数拆分 CATALOG-层级分段下的自动解析
String 图片解析开启后(TEXT 提取图片文本、IMAGE 保留原图) 缺省值:TEXT 枚举值: TEXT IMAGE 表7 SplitConf 参数 参数类型 描述 split_mode String 分段设置/层级解析模型 LENGTH-长度拆分,即为字数拆分 CATALOG-层级分段下的自动解析
String 图片解析开启后(TEXT 提取图片文本、IMAGE 保留原图) 缺省值:TEXT 枚举值: TEXT IMAGE 表8 SplitConf 参数 参数类型 描述 split_mode String 分段设置/层级解析模型 LENGTH-长度拆分,即为字数拆分 CATALOG-层级分段下的自动解析
Recognition)增强准确识别图片/表格等各式版面布局、配置开放、拆分优化等措施提升文档解析效果。 多模态输入和输出 基于业务数据生成问答结果,可溯源,输出结果图文并茂。 物理多租、租户隔离、全托管 支持物理多租、租户隔离、全托管服务,独享资源更稳定、性能更高。 产品架构 图1 KooSearch架构
"language":"CHINESE","parse_conf":{"ocr_enabled":true,"image_enabled":true,"image_conf":"IMAGE","header_footer_enabled":false,"catalog_enabled":false}
创建模型服务,对接MaaS的模型服务。 在KooSearch左侧导航栏选择“模型管理”,进入“模型管理”页面。 单击页面的“新建模型服务”,弹出新建模型服务页面。 图1 新建模型服务 在新建模型服务页面。根据下表填写对应参数后,单击“确定”按钮。 表4 新建模型服务 参数 说明 模型服务名称 自定义模型服务名称,不能为空。
则会被过滤。 单击“确定”。 体验搜索 在“体验平台”页面右上角单击“搜索”,切换至搜索体验。 在输入框中输入问题,单击,查看搜索结果。 图1 体验搜索 选中搜索结果,可查看更详细的内容。单击“阅读全文”,可查看文档原文。 当前针对上传的多栏排版docx文档,查看文档原文时存在内容显示错位及显示不全的问题。
未勾选,在文档中遇到图片默认跳过,不处理图片。 勾选后,有两种解析方式可供选择: 提取图片文本:识别图片内文字。 仅保留原图:将图片提取后上传OBS桶,便于问答图文展示。 解析页眉页脚 未勾选,解析结果中不包含页眉页脚。 勾选后,解析结果中包含页眉页脚。 解析目录页 未勾选,解析结果中不包含目录页。 勾选后,解析结果中包含目录页。
单击“确定”。 体验问答 在“体验平台”页面右上角单击“问答”,切换至问答体验页面。 在输入框中输入问题,单击,查看返回的答案。 图1 体验问答 表2 图标说明 图标 说明 认同内容,在对话框中输入正面反馈意见,单击“提交”。 不认同内容,在对话框中输入负面反馈意见,单击“提交”。 复制内容。
选择文档问答服务,单击操作列的“问答”,前往KooSearch控制台。 左侧导航栏选择“模型管理”,进入“模型管理”页面。 单击页面的“新建模型服务”,弹出新建模型服务页面。 图1 新建模型服务 在新建模型服务页面。根据下表填写对应参数后,单击“确定”按钮。 表1 新建模型服务 参数 说明 模型服务名称 输入模型服务名称,不能为空。