检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
智能分类。 除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别:提取图片内的文字及其对应位置信息。 手写文字识别:识别手写文字、印刷文字信息。 网络图
左侧导航窗格中,选择“用户组”页签,单击右上方的“+创建用户组”。 在“创建用户组”界面,输入“用户组名称”,创建用户组。 返回用户组列表,单击列表中的“授权”。 勾选需要授予用户组的权限,单击“确定”,完成用户组授权。 选择权限的作用服务。此处选择“文字识别(OCR)”,并为该用户组设置所需的权限。
“账单管理> 流水和明细账单 > 明细账单”进入明细账单列表,在筛选条件中选择“资源名称”,并输入步骤2复制的资源名称:“通用表格识别 PKG 1千”。 名称末尾添加“包年”(订单周期)后,单击图标即可搜索该资源的账单。如:通用表格识别 PKG 1千 包年。 图2 选择资源名称 图3
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK
{query-string} 尽管请求URI包含在请求消息头中,但大多数语言或框架都要求您从请求消息中单独传递它,所以在此单独强调。 表1 URI中的参数说明 参数 说明 URI-scheme 表示用于传输请求的协议,当前所有API均采用HTTPS协议。 endpoint 指定承载REST服务端点的服务器
“评估”:单击“评估”,继续上传测试图片评估模板。 “继续编辑”:单击“继续编辑”,返回“应用开发>框选参照字段”页面,继续编辑模板。 “返回列表”:单击“返回列表”,返回至应用详情页。 “调用API”:下方调用指南区域,可直接调用API或SDK轻松调用当前模板服务,详情请见调用API。 父主题:
“评估”:单击“评估”,继续上传测试图片评估模板。 “继续编辑”:单击“继续编辑”,返回“应用开发>框选参照字段”页面,重新编辑模板。 “返回列表”:单击“返回列表”,返回至应用详情页。 “调用API”:下方调用指南区域,提供了调用当前模板服务的请求样例,详情请见调用API。 父主题: 多模板分类工作流
"error_code":"ModelArts.4603","error_msg":"Obtaining the file from the URL failed. "表示从URL获取图片数据失败,可通过以下几个方面进行排查:(1)请确保提供的URL支持HTTP/HTTPS请求协议,即格式为http/https
入门实践 当您完成了调用API、调用SDK基本操作后,可以根据自身的业务需求使用OCR提供的入门实践。 表1 常用最佳实践 实践 描述 发票识别与验真 该实践基于华为云文字识别服务增值税发票识别与发票验真技术构建,自动识别和录入增值税发票各字段信息,减少人工核算工作量,实现财税报
称,如识别身份证照片,可新增字段类型“出生日期”。 “字段属性”:选择字段属性,可选择“自定义正则提取”和“自定义字典”,然后按表1填写相关信息。 表1 字段属性参数说明 字段属性 参数 参数说明 举例 自定义字典 取值范围 在识别当前字段类型的文字时,选择字典的取值范围中最相似的取值为最后识别结果。
不互通,请根据您的实际需求慎重选择。 表1 接口说明 类别 API 说明 智能文档解析 智能文档解析 对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。 通用类 通用表格识别 识别表格图片上的文字内容,并返回识别的结构化结果。
用并单击操作列的“查看”,进入应用详情页,可从“应用资产”和“应用开发”两个页签进入评估模板页面。 在“应用资产”页面,默认进入“分类器列表”页签,单击已有模板操作列的“评估”。进入“评估”页面。 图1 评估 在“应用开发”页面,依次完成“上传模板图片”、“定义预处理”、“框选参
使用SDK调用OCR服务 创建容器应用基本流程 05 API 通过开放的API和调用示例,您可以使用文字识别服务的通用表格识别、智能分类识别、护照识别等功能。 API文档 API概览 申请服务 通用表格识别 智能分类识别 身份证识别 护照识别 营业执照识别 火车票识别 增值税发票识别 飞机行程单识别
详细操作请见6.2 新建应用。您可以创建单模板服务,通过模板配置文字识别模型,实现单模板图像的文字信息结构化提取。 图1 创建单模板流程 表1 创建单模板流程说明 流程 说明 详细指导 上传模板图片 在使用单模板工作流开发应用之前,需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。
参见变更计费模式。 计费项 文字识别按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。 如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。 续费 套餐包文字识别
文字识别服务等级协议请参见华为云服务等级协议。 OCR能力 通用类 OCR 通用类OCR(General OCR),支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。 证件类 OCR 证件类OCR(Card OCR),支持身份证、驾驶证、
Build()) } endpoint是华为云各服务应用区域和各服务的终端节点,详情请查看 地区和终端节点 。 发送请求并查看响应 // 以调用通用表格识别接口 RecognizeGeneralTable 为例 request := &model.RecognizeGeneralTableRequest{}
板分类工作流。 情形3:多模板识别工作流出错,大部分字段为空或错误。 解决办法:先检查分类结果是否正确(返回结果中的template_id表示分类结果),若分类错误,则说明分类器中存在相似的模板导致分类出错,请在参照字段中添加模板特有的参照字段,从而提高分类的鉴别能力。若分类结果
ocr:generalTable:subscribe 开通通用表格识别服务 √ × ocr:generalTable:unsubscribe 取消开通通用表格识别服务 √ × ocr:generalTable:getSubscribeUserList 查询开通通用表格识别的用户列表 √ √ ocr:genera