检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户,用户使用Python、Java等编程语言调用OCR服务API将图片、扫描件或PDF、OFD文档中的打印字符识别成可编辑的文本格式,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。 产品介绍 在线体验 图说ECS 立即使用 成长地图 由浅入深,带您玩转OCR 01
描述 image 否 String 与url二选一。 图片的Base64编码,要求base64编码后大小不超过10MB。 图片最小边不小于15px,最长边不超过8192px,支持JPEG、JPG、PNG、BMP、TIFF格式。 图片Base64编码示例如/9j/4AAQSkZJRgABAg
销货清单的备注。 当传入图片为发票销货清单时返回此字段。 belong_issue_date String 销货清单的填开日期。 当传入图片为发票销货清单时返回此字段。 sales_mark Boolean 是否是销货清单: true:输入图片是销货清单。 false:输入图片不是销货清单。
String 与image二选一。图片的url路径,目前支持: 公网http/https url OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限>。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
与image二选一。 图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 return_text_location
登录华为云对象存储服务控制台,查看部署完成后,自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件。 图2 上传待识别发票 选择用于存放结果的“ocr-invoice-r
OCR服务坚持“华为云始终把可信作为产品质量的第一要素”的理念,我们基于安全、合规、隐私、韧性、透明,为您提供有技术、有未来、值得信赖的云服务。 OCR服务承诺用户识别的图片与识别结果全部不作任何形式留存,识别返回后立即释放。 具体的声明请参考隐私政策声明和法律声明,可信资源请参见白皮书资源。关于文字识别的相关声明请参见文字识别服务声明。
授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 template_id 否 String 该参数与classifier_id二选一。
描述 image 否 String 与url二选一 图片的Base64编码,要求Base64编码后大小不超过10MB。 图片最短边不小于15px,最长边不超过8192px,支持JPEG、JPG、PNG、BMP、TIFF格式。 图片Base64编码示例如/9j/4AAQSkZJRgABAg
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 模板总览 评估 调用指南 编辑应用 删除应用 父主题: 自定义OCR
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估 调用指南 编辑应用 删除应用 父主题: 自定义OCR
类型 是否可选 参数解释 默认值 image_bucket_name string 必填 桶名称,用于上传发票图片或PDF文件。 OBS桶名称,全局唯一,用于上传发票图片或PDF文件。取值范围:支持小写字母、数字、中划线(-)、英文句号(.)。 无默认值,桶名可以自定义。例如命名
授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 return_seal_image
ModelArts.0212报错处理方法 ModelArts.4603、ModelArts.4704报错处理方法 ModelArts.4204报错处理方法 图片质量类报错处理办法
若多识别出文字,可能是识别区太大,将周边无关的文字也框进来了,需将识别区改小一点。 若上述办法均无法解决,请检查识别区的文字是否发生了偏移,或者识别图片是否跟模板属于相同版式。 父主题: 常见问题
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
API 智能文档解析 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 印章识别 身份证识别 户口本识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 不动产证识别 车辆合格证识别 道路运输从业资格证识别 车牌识别 名片识别 VIN码识别
入成本。 支持区域: 华北-北京四 通用文字识别API 网络图片识别 支持识别网络图片中的所有印刷体、艺术字等文字信息,可识别中英文及部分繁体字以及常见网络图片如:手机截图、电脑截图、电商产品图及广告设计图等互联网图片,能够返回位置坐标和置信度,方便用户进行版式的二次处理以及提高
重试请求;也可以后端检查上一个请求结果,上一个请求返回之后再发送下一个请求,避免请求过于频繁。 请检查图片是否过大,或网络延时过长,如果图片过大,在保证图片清晰度前提下可以对图片进行等比例压缩;如果网络延时较长,可以适当提升网络传输速度。 如以上方案无法解决问题,请联系我们。 父主题:
supported. 图片格式不支持,或image参数值不是base64编码字符串。 请检查图片格式,各服务支持图片格式请参考使用限制。 AIS.0103 The image size does not meet the requirements. 图片尺寸不满足要求。 请检查图片尺寸,各服务支持图片尺寸请参考使用限制。