检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
能处理反光、暗光等干扰的图片但影响识别精度。
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。
框选参照字段 在识别文字的过程中,套件会先对图片进行模板分类,再检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了正确分类并校正待识别的图片,这就需要在模板图片中指定参照字段。
哥伦比亚身份证识别 功能介绍 识别哥伦比亚身份证中的文字信息,并将识别的结构化结果返回给用户。 约束与限制 支持哥伦比亚身份证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。
OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明。
OCR服务是否支持二维码识别 不支持二维码识别。 父主题: 产品咨询类
若多识别出文字,可能是识别区太大,将周边无关的文字也框进来了,需将识别区改小一点。 若上述办法均无法解决,请检查识别区的文字是否发生了偏移,或者识别图片是否跟模板属于相同版式。 父主题: 常见问题
说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 page_num 否 Integer 指定PDF页码识别。
为其余子用户取消开通车牌识别服务 √ × ocr:webImage:subscribe 开通网络图片识别服务 √ × ocr:webImage:unsubscribe 取消开通网络图片识别服务 √ × ocr:webImage:getSubscribeUserList 查询开通网络图片识别的用户列表
该方案支持识别发票图片,发票PDF、OFD文件。其中,图片支持JPEG、JPG、PNG、BMP、TIFF格式,多页PDF仅识别第一页。 同一张发票每天最多可查验真伪5次;可查验最近5年内(国家税务总局)增值税发票管理系统开具的发票。
图解文字识别
身份证识别可以判断身份证真假么 不支持判断身份证的真假,该服务可以识别身份证图片中的文字内容,并将识别的结果以json格式返回给用户。 父主题: 产品咨询类
评估 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成框选识别区步骤,详情请见框选识别区。
定义预处理 使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。
道路运输从业资格证 自动识别道路运输从业资格证,根据不同版式内容返回对应的关键文字信息,可用于货运场景资质审核场景。 车辆合格证 自动识别出车辆合格证图片的文本内容,并返回结构化字段信息。 不动产证 自动识别出不动产证图片的文本内容,并返回结构化字段信息。
API是否可以混用 不建议混用,例如有专门的身份证识别,就不建议使用“通用文字识别”识别身份证图片,不同接口底层算法不同,混用会导致识别效果差。 父主题: API使用类
在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线图片作为测试图片。 上传图片后,右侧会显示文字识别结果,包括“识别区”和对应的“识别结果”。 上传图片后,您可以核对识别结果是否正确。
图3 获取识别结果文件 通过华为云SDK使用 企业业务系统可通过华为云提供的SDK服务与OBS桶进行对接,当员工上传发票图片或者电子发票PDF文件到华为云OBS桶后,即可自动进行文字识别和验真,企业业务系统只需定时从存储结果的OBS桶中获取结果,即可实现发票报销的自动化处理流程。
定义预处理 使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。
准备数据 数据要求 受技术与成本多种因素制约,文字识别服务存在一些约束限制。 以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。