检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
智能文档解析 功能介绍 对证件、票据、表单等多版式文档进行文字识别、版面分析、键值对提取以及表格识别等任务,并以json格式返回识别的结构化结果。 约束与限制 支持中英文及部分中文繁体字。 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、P
识别结果后处理 提取特定字段导入Excel 本示例调用身份证识别API,并从获取到的JSON结果中,提取所需的字段,填入至Excel。 前提条件 开通身份证识别。 参考本地调用,安装OCR Python SDK。并执行pip install xlsxwriter命令安装依赖包。
创建应用 在使用自定义OCR开发应用之前,需要创建应用,填写应用基本信息、选择工作流。 前提条件 保证华为云账号不欠费。在使用自定义OCR产品时,需在“文字识别”控制台页面订阅自定义OCR服务。 如果您的账号是IAM账号,在创建应用前,请先使用管理员账号为IAM用户授予文字识别服务(Optical
审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录OCR的管理事件和数据事件用于审计。
功能体验与试用 文字识别(Optical Character Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功
不动产证识别 功能介绍 识别不动产证中的文字信息,并返回识别的结构化结果。 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 支持图像中不动产证任意角度的水平旋转。
驾驶证识别 功能介绍 识别驾驶证图片中主页与副页的文字内容,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 驾驶证示例图 图2 电子驾驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制
道路运输从业资格证识别 功能介绍 识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。 图1 道路运输从业资格证示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比
自定义模板OCR OCR自定义模板将于2025.12.31正式下线,为避免影响您目前的业务,请您及时进行相关迁移工作,迁移指导详见OCR自定义模板下线公告。 功能介绍 自定义模板OCR,支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面操作,指定需要识别的关键字段,
出租车发票识别 功能介绍 识别出租车发票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 出租车发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、J
开始使用 通过华为云控制台使用 登录华为云对象存储服务控制台,查看部署完成后,自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件。 图2 上传待识别发票
车辆通行费发票识别 功能介绍 识别车辆通行费发票中的关键文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 车辆通行费发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持
车牌识别 功能介绍 识别输入图片中的车牌信息,并以JSON格式返回其坐标和内容。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 车牌示例图 支持车牌信息、车牌颜色识别,支持双行车牌识别,支持单张图片内多个车牌识别。 目前支持车牌类型含小型汽车
发票验真 功能介绍 支持10种增值税发票的信息核验: 增值税专用发票、增值税普通发票、增值税普通发票(卷式)、增值税电子专用发票、增值税电子普通发票、增值税电子普通发票(通行费)、二手车销售统一发票、机动车销售统一发票、区块链电子发票、全电发票,支持返回票面的全部信息。 该接口的
车辆合格证识别 功能介绍 识别车辆合格证中的文字信息,并返回识别的结构化结果。 约束与限制 只支持中国大陆车辆合格证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 图像中识别区域有效占比超过80%,保证整张车辆合格证内容及其边缘包含在图像内。
身份证识别 功能介绍 识别身份证图片中的文字内容,并将识别的结果以JSON格式返回给用户。支持身份证翻拍、PS、模糊、反光、边框完整性、边框内异物遮挡、复印件和临时身份证告警功能。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 身份证信息核验请使用人证核身服务。
火车票识别 功能介绍 识别火车票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 火车票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
网络图片识别 功能介绍 识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别,支持字体分类和长图检测。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 网络图片示例图 约束与限制 支持中英文及部分中文繁体字。
飞机行程单识别 功能介绍 识别飞机行程单中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 飞机行程单示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JP
通用表格识别 功能介绍 识别表格图片中的文字内容,并将识别的结果以JSON格式返回给用户。返回结果将图片区域(words_region)划分为两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。该接口的使用限制请参见约束与限制,详