什么是文字识别OCR?
文字识别OCR服务介绍
文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。
OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》。
OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》。
OCR平台有哪些能力?
1、通用类 OCR:通用类OCR(General OCR),支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。
2、证件类 OCR:证件类OCR(Card OCR),支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。
3、票据类 OCR:票据类OCR(Receipt OCR),支持增值税发票、机动车销售发票、医疗发票等各种发票和表单图片上有效信息的自动识别和结构化提取。
4、行业类 OCR:行业类OCR(Domain OCR),支持物流面单、医疗化验单据等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。
5、定制模板 OCR:定制模板OCR(Custom OCR),支持用户自定义识别模板,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。
华为云文字识别OCR有哪些功能?
文字识别OCR通用类功能介绍:
1、通用表格识别:提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。
2、通用文字识别:提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。
3、手写文字识别:识别文档中的手写文字信息,并将识别的结构化结果返回给用户。
4、网络图片识别:自动识别网络图片内的所有文字及其对应位置信息,并能根据识别出来的结果进行联系人信息的提取,同时可供进一步的数据挖掘后处理操作。
5、智能分类识别:自动检测定位图片上指定要识别的票证,一次扫描即可识别票证的位置坐标、结构化识别的内容以及对应的类别。
文字识别OCR智能分类功能介绍:
智能分类识别服务可以一次性对同张图片中的多个卡证、票据进行检测和识别,并返回每个卡证、票据的类别及结构化数据。
文字识别OCR证件类功能介绍:
1、身份证识别:自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息,在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别身份证信息。
2、驾驶证识别:自动识别驾驶证正页与副页上的全部信息,自动提取出姓名、性别、领证日期、准驾车型、有效期限、档案编号等结构化信息,在暗光、倾斜、过曝光、防伪标志干扰、阴影等异常条件下均可准确识别驾驶证信息。
3、行驶证识别:自动识别行驶证正页与副页上的全部信息,自动提取出号牌号码、车辆类型、所有人、使用性质、品牌型号、车辆识别代号、发动机号码、注册日期、档案编码、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录、条码号等结构化信息,在暗光、倾斜、过曝光、防伪标志干扰、阴影等异常条件下均可准确识别行驶证信息。
4、护照识别:针对中国护照,可识别护照上的全部信息;针对其他国家护照,可根据两行国际标准化的机读码识别出6-7个关键字段信息,包括姓名、性别、出生日期、护照号码、签发国国家码、护照有效期等。在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别护照信息。
5、营业执照识别:识别营业执照中的公司名称、注册号、法人代表、地址、注册资本、营业期限、经营范围等字段。 在暗光,倾斜、水印等异常条件下均可正常识别执照信息。
6、银行卡识别:自动识别银行卡正面的信息,识别信息包括卡片类型(借记卡或信用卡)、银行卡卡号、有效日期、发卡行、持卡人姓名(限信用卡)。省去手动录入过程。
文字识别OCR票据类功能介绍:
1、增值税发票识别:通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段,快速将增值税发票上的文字信息识别出来,用于后续的进一步处理,节省大量的人工录入成本。
2、机动车销售发票识别:自动识别机动车销售发票图片内的文本内容,并返回结构化字段信息,用于后续的进一步处理,节省大量的人工录入成本。
3、飞机行程单识别:自动识别飞机行程单的全部信息,一次扫描即可识别旅客姓名、有效身份证件号码、订单号、票价等全部信息。
4、定额发票识别:自动识别定额发票的全部信息,一次扫描即可识别发票号码、发票代码、地址、发票金额等全部信息。
5、火车票识别:自动识别火车票的全部信息,一次扫描即可识别一张车票的ID、检票口信息、车次等全部信息。
6、出租车发票识别:自动识别出租车发票的全部信息,一次扫描即可识别归属地区、发票代码、发票号码、电话(包括电话、监督电话)等全部信息。
文字识别OCR在线体验的计费项有哪些?
按API调用次数计费,计费价格请参见价格计算器。
只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。
文字识别OCR的计费模式:
按需计费:默认计费方式,指按照API调用次数收费,按次进行结算。
套餐包计费:
1、相比“按需计费”具有更大折扣。
2、套餐包有效期为1年,到期不会自动顺延,请在有效期内使用完。
3、套餐包到期后或套餐包使用完后,如果没有及时续费或购买新的套餐包,系统将自动转为按需计费方式。
4、套餐包费用为一次性支付,即刻生效,暂不支持指定日期生效。
5、套餐包可叠加使用,如果您购买了多个套餐包,则套餐包的扣减规则如下:
按照套餐包来源类型扣费,扣减优先级由高到低为:免费额度->套餐包计费->按需计费。
按套餐包创建、生效、失效时间扣费。
多个套餐包,创建时间相同时,优先抵扣先生效的。
多个套餐包,生效时间相同时,优先抵扣先失效的。
多个套餐包,失效时间相同时,优先抵扣先创建的。