检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
常见问题 什么情况下可以使用自定义模板? 如何选取参照字段? 识别结果容易漏字或多识别出内容怎么办? 识别字符出现错误如何优化? 自定义模板OCR取消开通后,是否会将之前创建好的模板删除? 父主题: 自定义OCR
发票PDF文件到华为云OBS桶后,即可自动进行文字识别和验真,企业业务系统只需定时从存储结果的OBS桶中获取结果,即可实现发票报销的自动化处理流程。SDK详细使用流程可参考OBS SDK用户指南。 结果示例 示例发票 示例结果 发票识别与验真结果如下所示,'status'字段为'
字段类型 在“框选识别区”页面,可以给每个字段指定字段类型来提高识别准确率,或是将文字识别结果处理成业务需要的格式。勾选字段类型后,后台会对文字识别结果进行相应的处理后再输出。每个识别区可选择多个字段类型,多个字段类型会按照勾选顺序执行。自定义OCR控制台提供了默认字段类型和自定义字段类型两种功能。
编辑模板 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“模板总览”、“评估”、“调用指南”步骤的信息,重新部署模板。操作指引如下: 上传模板图片 定义预处理 框选参照字段 框选识别区 模板总览 评估 调用指南 父主题: 多模板分类工作流
Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功能。该方式无需编程,只需在网页端上传图片,即可体验识别效果。 开通OCR后,默认
图2 模板列表 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“评估”步骤的信息,重新编辑模板。操作指引如下: 上传模板图片 定义预处理 6.3.4-框选参照字段 6.3.5-框选识别区 6.3.6-评估 6.3.7-调用指南
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
费项”页签查询全部待续费资源,对资源进行手动续费的操作。 图2 续费管理 所有需手动续费的资源都可归置到“手动续费项”页签,具体操作请参见如何恢复为手动续费。 手动续费资源。 单个续费:在资源页面找到需要续费的资源,单击操作列的“续费”。 图3 单个续费 批量续费:在资源页面勾选
获取识别结果 解读识别结果 识别结果后处理
审计 支持云审计的关键操作 如何查看审计日志
成本管理 随着上云企业越来越多,企业对用云成本问题也越发重视。使用文字识别服务OCR时,如何进行成本管理,减轻业务负担呢?本文将从成本构成、成本分配、成本分析和成本优化四个维度介绍成本管理,帮助您通过成本管理节约成本,在保障业务快速发展的同时获得最大成本收益。 成本构成 使用文字
权限类 使用OCR服务需要的权限 如何通过主账号创建IAM账号 无权在控制台服务监控查看数据
已在自定义OCR控制台选择“多模板分类工作流”创建应用,并对上传的模板图片进行预处理,详情请见定义预处理。 操作步骤 图1 多模板框选参照字段 在“应用开发>框选参照字段”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。 单击左上方操作图标,调整当前模板图片到合适大小和位置。 单
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估 调用指南 编辑应用 删除应用 父主题: 自定义OCR
图像各边的像素大小在15px到8192px之间。 支持单图多印章识别。 支持图像中印章任意角度的水平旋转。 支持圆形章、椭圆章、方形章、三角章和菱形章的检测和识别。 能处理反光、暗光等干扰的图片但影响识别精度。 身份证识别 支持中华人民共和国居民身份证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 模板总览 评估 调用指南 编辑应用 删除应用 父主题: 自定义OCR
目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文档解析。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 调用方法 请参见如何调用API。 前提条件 在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务和认证鉴权章节。 用户首次使用需要先申请开通。
OCR的并发是多少 文字识别服务属于公有云服务,线上用户资源共享,并发量会根据线上用户的调用情况动态调整。 如遇到突发高峰导致的并发量不够用的情况,您可以尝试以下两种解决方法: 通过重试机制,在代码里检查返回值,碰到并发错误可以延时一小段时间(如2-5s)重试请求。 后端检查上一
片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。 确认信息后,单击“下一步”,进入定义预处理步骤,对上传的模板图片进行自动旋转预处理。 父主题: 通用单模板工作流
识别结果容易漏字或多识别出内容怎么办? 识别结果是根据识别区来进行提取的,识别区的位置和大小均会影响识别结果。 若结果漏字,可能是由于识别区太小导致的,需在相应模板的"框选识别区"页面,把漏字的识别区调大一些。 若多识别出文字,可能是识别区太大,将周边无关的文字也框进来了,需将识别区改小一点。