检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
需要定制识别的字段。例如上传某一格式的发票图片作为模板,配置文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已在“自定义OCR”控制台选择“通用单模板工作流”创建应用,详情请见6.2新建应用。 提前准备待识别的图片,图片要求请见图片要求。 图片要求 保证图片质量:不
接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 page_num 否 Integer 指定PDF页码识别。传入该参数时,则识别指定页码的内容。如
承兑汇票识别 功能介绍 识别承兑汇票识别中的关键字段, 并以json格式返回结构化结果。 约束与限制 只支持中英文。 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片。 图像各边的像素大小在15px到8192px之间。 图像
户口本识别 功能介绍 识别户口本中的文字信息,并返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
快速部署 本章节主要指导用户如何自动化部署“文字识别-发票识别与验真”解决方案。 表1 参数说明 参数名称 类型 是否可选 参数解释 默认值 image_bucket_name string 必填 OBS桶名称,全局唯一,用于上传发票图片或PDF文件。取值范围:3~59个字符,支持
OCR文字识别服务计费可以按照项目来分别计费吗 可以。 OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用进行分账。 详情请参考API接口文档里的Enterprise-Project-Id参数。 父主题: 计费FAQ
飞机行程单识别 功能介绍 识别飞机行程单中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 飞机行程单示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JP
机动车销售发票识别 功能介绍 识别机动车销售发票、二手车销售发票图片中的文字内容,服务能自动分辨两种类型,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 机动车销售发票示例图 图2 机动车销售发票示例图 图3
监控 文字识别的监控指标 查看监控指标
银行卡识别:识别银行卡上的关键文字信息,并返回识别的结构化结果。 营业执照识别:识别营业执照图片中的文字信息,并返回识别的结构化结果。 商用 - 3 新增护照识别、道路运输证识别 护照识别:识别护照图片中的文字信息,并返回识别的结构化结果。 道路运输证识别:识别道路运输证中的文字信息,并返回识别的结构化结果。
实施步骤 准备工作 快速部署 开始使用 快速卸载
实施步骤 准备工作 快速部署 开始使用 快速卸载
常小,几乎可忽略不计。 在客户使用OCR能力,进行二次开发时,可以尽可能的通过页面可视化提醒等方式,引导使用者尽量拍摄符合人眼易于识别的图片,以保障数据质量、同时提升识别准确率。 由于图片的输入非常开放,因此为了避免恶意攻击,在公有云上对有效识别的信息(即便部分不准)也会计费,类似于在通话质量不佳时通常也是要求计费。
修订记录 发布日期 修订记录 2023-04-30 第一次正式发布。
修订记录 表1 修订记录 发布日期↵ 修订记录↵ 2022-03-30 第一次正式发布。↵ 2023-03-08 修订实施步骤。 2024-08-22 适配函数工作流EventGrid触发器。
具体请参考华为云官网价格详情,实际收费以账单为准: 表1 资源和成本规划 华为云服务 计费说明 每月花费(调用1000次) 文字识别服务 增值税发票识别: 0.18元/次 发票验真:0.23元/次 410元 对象存储服务 数据存储(多AZ存储):0.1390元/GB/月 请求费用:0
计费概述 通过阅读本文,您可以快速了解文字识别OCR的计费模式、计费项、续费、欠费等主要计费信息。 计费模式 文字识别提供按需计费和套餐包计费两种计费模式,以满足不同场景下的用户需求。按需计费是一种后付费模式,即先使用再付费,按照文字识别服务实际调用次数计费。套餐包计费是一种预付
按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。 购买文字识别服务请参考如何选购合适的API。 如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。
泰文身份证识别 功能介绍 识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制
OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明。 文字识别服务等级协议请参见华为云服务等级协议。