检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。
证件类 功能介绍 身份证识别 自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息。 户口本识别 自动识别居民户口本户主页及成员页,并返回部分关键字段信息。
父主题: 发票识别与验真
图2 上传待识别发票 选择用于存放结果的“ocr-invoice-result-bucket”桶,即可自动获取该发票的识别与验真结果,以发票文件名称为前缀的JSON文件存储。
停售产品套餐包规格如下: 商品名 规格 电子面单识别 电子面单识别套餐包1000万次 电子面单识别套餐包500万次 电子面单识别套餐包100万次 电子面单识别套餐包50万次 电子面单识别套餐包10万次 电子面单识别套餐包1万次 电子面单识别套餐包1千次 如您有任何问题,可随时通过工单或者服务热线
准备工作 开通文字识别服务 登录文字识别控制台。 在控制台左上角选择区域为“北京四”,并开通“增值税发票识别”、“发票验真”。 开通后,默认为按需计费。 图1 开通管理 完成文字识别对OBS服务授权。 在文字识别控制台,选择“服务授权”,单击开通授权。
图2 确认删除 一键卸载 登录发票识别与验真解决方案部署页面。 单击方案堆栈后的“删除”。 图3 一键卸载 在弹出的删除堆栈确认框中,输入方案的堆栈名称,单击“确认”,即可卸载解决方案。 图4 删除堆栈确认 父主题: 实施步骤
在客户使用OCR能力,进行二次开发时,可以尽可能的通过页面可视化提醒等方式,引导使用者尽量拍摄符合人眼易于识别的图片,以保障数据质量、同时提升识别准确率。
识别身份证正反面总计调用几次接口 使用身份证识别时,如果要识别身份证的正面和反面,需要您调用两次身份证识别接口,具体请参见身份证识别章节。 父主题: API使用类
印章识别 支持JPEG、JPG、PNG、BMP、TIFF、PDF格式,多页PDF默认识别第一页,或者您可以指定要识别的页码。 图像各边的像素大小在15px到8192px之间。 支持单图多印章识别。 支持图像中印章任意角度的水平旋转。
OCR服务一次可以识别多张身份证吗 不可以一次识别多张身份证,您可以通过循环调用身份证识别API实现多张身份证识别。 父主题: 产品咨询类
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。
身份证识别可以判断身份证真假么 不支持判断身份证的真假,该服务可以识别身份证图片中的文字内容,并将识别的结果以json格式返回给用户。 父主题: 产品咨询类
增值税发票识别支持哪些发票 目前已经支持增值税专用发票和增值税普通发票(含电子普通发票)。卷式发票和通行费发票即将上线,并且支持发票备注、监制章、专用章、发票联次等字段。具体请参见增值税发票识别章节。 父主题: 产品咨询类
图1 一键部署发票识别与验真 在选择模板界面中,直接单击“下一步:配置参数”。 图2 选择模板 在配置参数界面中,自定义填写堆栈名称。根据表完成参数配置后,单击“下一步:高级配置”。
识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。
说明: 参数传入示例: "kv_map":"{"名称":"姓名"}" erase_seal 否 Boolean 是否进行印章擦除。开启后,可提升印章遮挡区域的文字识别精度。 pdf_page_number 否 Integer 指定PDF页码识别。
认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。 Token认证 Token在计算机系统中代表令牌(
OCR服务识别结果可以转化为Word、TXT、pdf吗 OCR提取之后返回的结果是JSON格式,需要用户通过编程,将结果保存为Word、TXT、pdf格式。 父主题: API使用类