检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
旧版退票 confidence Object 字段的置信度,取值范围0~1。 置信度越大,本次识别的字段的可靠性越高,在统计意义上,置信度越大,准确率越高。 置信度由算法给出,不直接等价于字段的准确率。 共享字段 text_location Object 对应所有在原图上识别到的字段
t_id。 检查URI中的区域信息是否和开通服务的终端节点一致。 图1 开通服务的终端节点 图2 URI中的区域信息 HTTP请求方法(POST,GET等)是否正确。 具体的URI信息请在各接口的API页面查看。 父主题: 错误码类
ia-id-card”,“project_id”为项目ID,获取方法请参见获取项目ID。 如何获取Token请参见认证鉴权。 传入哥伦比亚身份证图片的base64编码进行文字识别 POST https://{endpoint}/v2/{project_id}/ocr/colombia-id-card
Integer 指定PDF页码识别。传入该参数时,则识别指定页码的内容。如果不传该参数,则默认识别第1页。 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result SealResult object 调用成功时表示调用结果。 调用失败时无此字段。 表5 SealResult
ext”,“project_id”为项目ID,获取方法请参见获取项目ID。 如何获取Token请参见认证鉴权。 传入图片的base64编码进行文字识别,识别过程不校验图片倾斜角度,并关闭快速模式 POST https://{endpoint}/v2/{project_id}/ocr/general-text
时的类型。 调用方法 请参见如何调用API。 前提条件 在使用之前,你需要通过OCR控制台,完成自定义OCR工作流的开发。开发、部署完成后,将在工作流的部署页面生成API的URI。 自定义OCR工作流开发过程,可参考自定义OCR介绍。 URI POST /v2/{project_
meet the requirements." } 其中,error_code表示错误码,error_msg表示错误描述信息。 父主题: 如何调用API
ht-itinerary”,“project_id”为项目ID,获取方法请参见获取项目ID 如何获取Token请参见认证鉴权。 传入飞机行程单图片的base64编码进行文字识别 POST https://{endpoint}/v2/{project_id}/ocr/flight-itinerary
识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中
iland-id-card”,“project_id”为项目ID,获取方法请参见获取项目ID 如何获取Token请参见构造请求。 请求示例(方式一:使用图片的Base64编码) POST https://{endpoint}/v2/{project_id}/ocr/thailand-id-card
al-statement”,“project_id”为项目ID,获取方法请参见获取项目ID。 如何获取Token请参见认证鉴权。 传入财务报表图片的base64编码进行文字识别 POST https://{endpoint}/v2/{project_id}/ocr/financial-statement
使用文字识别服务时,可以通过配置OBS访问权限搭配使用。服务只需要配置一次即可,后面使用时无需再次配置,详细信息请参见配置OBS访问权限章节。 父主题: 如何调用API
返回"error_code": "APIGW.0101" 请检查获取Token使用的url是否正确。以获取华北-北京四区域的token为例,采用post请求,url为: https://iam.cn-north-4.myhuaweicloud.com/v3/auth/tokens 父主题:
old-register”,“project_id”为项目ID,获取方法请参见获取项目ID。 如何获取Token请参见认证鉴权。 传入户口本图片的base64编码进行文字识别 POST https://{endpoint}/v2/{project_id}/ocr/household-register
eptance-bill”,“project_id”为项目ID,获取方法请参见获取项目ID。 如何获取Token请参见认证鉴权。 传入承兑汇票图片的base64编码进行文字识别 POST https://{endpoint}/v2/{project_id}/ocr/acceptance-bill
ate”,“project_id”为项目ID,获取方法请参见获取项目ID获取项目ID。 如何获取Token请参见认证鉴权。 传入道路运输从业资格证图片的base64编码进行文字识别 POST https://{endpoint}/v2/{project_id}/ocr/trans
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
advanced_mode 否 Boolean 默认为false,如果传参为true,则返回更多字段,具体请参见表5。 return_text_location 否 Boolean 默认为false,如果传参为true,则返回text_location字段表示文本框在原图位置。
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平