检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择“账单管理>流水和明细账单>明细账单”,在如下图所示位置,获取资源名称和区域。 图1 资源名称和区域 单击左侧导航栏的图标,选择“人工智能 > 文字识别 OCR”。 进入文字识别“总览”页面。 选择资源所在的“区域”,单击对应的类别,进入产品列表。 单击对应产品操作列的“开通管理”,在对应账号的操作列单击“取消服务”。
import com.huaweicloud.sdk.ocr.v1.region.OcrRegion; import com.huaweicloud.sdk.ocr.v1.*; import com.huaweicloud.sdk.ocr.v1.model.*; public class
与image二选一。 图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 响应参数 状态码:
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
OBS桶,企业业务系统定时从该桶中获取结果并处理。 函数工作流 FunctionGraph:用于实现调用文字识别服务的业务逻辑,当OBS桶收到上传的发票文件后,会自动通知函数调用文字识别服务,并将结果存放到指定的OBS桶里。 文字识别 OCR:提供发票识别与验真服务,识别用户上传的发票内容以及对接国税局系统进行真伪验证。
存储中的图片进行处理,并且可以快速获取到处理后的图片。 应用场景 图片处理支持用户在云端对图片进行简单的缩略、剪切、压缩等操作,不需下载占用空间巨大的本地图片处理软件即可直接在线对图片进行处理。 例如,可以随时随地在线对在云相册中的图片进行效果、缩略设置后,即刻在线将图片分享给好友、同事等。
API 智能文档解析 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 印章识别 身份证识别 户口本识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 不动产证识别 车辆合格证识别 道路运输从业资格证识别 车牌识别 名片识别 VIN码识别
功能体验与试用 文字识别(Optical Character Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功
import com.huaweicloud.sdk.ocr.v1.region.OcrRegion; import com.huaweicloud.sdk.ocr.v1.*; import com.huaweicloud.sdk.ocr.v1.model.*; public class
ModelArts Pro的文字识别套件提供了通用单模板工作流,通过工作流指引可构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。 本章节提供一个身份证样例,帮助您快速熟悉使用文字识别套件中的通用单模板工作流开发应用的过程。通过上传模板图片、框选参照字段和识别
图片处理如何收费? 详细的服务资费费率标准请参见产品价格详情(单击链接跳转后选择价格详情页签)。 计费因子 原始图片大小 以GB为单位,根据使用月份数按固定单价收费。 图片处理根据原始图片的大小来进行计费,使用图片处理对多张图片进行处理时,数据大小自动累计。例如:将一张0.01GB的图片使用图片处理剪切和压缩后仅为0
import com.huaweicloud.sdk.ocr.v1.region.OcrRegion; import com.huaweicloud.sdk.ocr.v1.*; import com.huaweicloud.sdk.ocr.v1.model.*; public class
com/v2/{project_id}/ocr/bankcard”,“project_id”为项目ID,获取方法请参见获取项目ID 如何获取Token请参见认证鉴权。 传入银行卡图片的base64编码进行文字识别 POST https://{endpoint}/v2/{project_id}/ocr/bankcard
费,不执行不产生费用。 文字识别 OCR:提供在线文字识别服务,将图片或扫描件中的文字识别成可编辑的文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。 人证核身服务 IVS:将用户本人与身份证信息关联起来,应用人脸识别与文字识别等技术,对接权威数据库,
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
import com.huaweicloud.sdk.ocr.v1.region.OcrRegion; import com.huaweicloud.sdk.ocr.v1.*; import com.huaweicloud.sdk.ocr.v1.model.*; public class
传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”步骤,单击“下一步”,进入“评估”页面。 本地上传图片 图2 评估模板 在“应用开发>评估”页面,默认进入“本地上传”页签。 单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 测试图片上传成功后,右侧会显示识别结果。
概述 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interf
IVS进行人证核身,并将结果转存到OBS桶里。 文字识别 OCR和人证核身服务 IVS:提供证件识别和人证核身服务,识别用户上传的证件图片以及人脸图片核对,并将结果以JSON格式返回。 方案优势 支持场景多 支持身份证、行驶证、驾驶证、道路运输证、道路运输从业资格证五种证件的图片识别和人证核身服务,打通服务壁垒,提供更好的业务场景支持。
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。