检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文字识别套件 行业套件介绍 新建应用 通用单模板工作流 多模板分类工作流 调用API和SDK 查看应用详情 删除应用
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
OCR服务是否支持二维码识别 不支持二维码识别。 父主题: 产品咨询类
请求Body参数 参数 是否必选 参数类型 描述 id 是 String 图片ID elementName 否 String 图片名称,要更新的图片名称 最小长度:1 最大长度:255 elementUrl 否 String 图片url 最小长度:1 最大长度:255 isDisplay 否
图片删除 功能介绍 图片删除 URI POST /v1/{project_id}/trace/trace-sweepcode/product-image/delete 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户从IAM申请到的projectid,一般为32位字符串
返回数据 表5 data 参数 参数类型 描述 id String 图片ID elementName String 图片名称 elementUrl String 图片url imageType String 图片类型 isDisplay String 是否展示:0展示,1不展示 merchant
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
和中划线,以大/小写字母开头,以字母或数字结尾。 ocr-shipping-label-recognition-demo image_bucket_name String 必填 OBS桶名称,全局唯一,用于上传网络及电子面单图片。取值范围:3-63个字符,支持小写字母、数字、中划线(-)、英文句号(
详细指导 上传模板图片 在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照
API是否可以混用 OCR服务支持批量识别吗 OCR服务识别结果可以转化为Word、TXT、pdf吗 如何获取图片base64编码 OCR的并发是多少 调用OCR服务的区域可以与OBS资源的区域不一致吗 识别身份证正反面总计调用几次接口 如何提高识别精度 如何提高识别速度 pdf转图片方法 是否支持从非华为云存储中读取图片
处理图片持久化 图片处理持久化支持将处理后的图片同步存储至指定的OBS桶中,方便下次直接访问处理后的图片,减少图片处理花费的时间,提升用户体验。 图片处理持久化目前仅支持通过接口调用模式使用。在图片处理请求接口中,以参数名=参数值的格式,发送图片处理持久化请求,具体参数说明如表1所示。
import com.huaweicloud.sdk.ocr.v1.region.OcrRegion; import com.huaweicloud.sdk.ocr.v1.*; import com.huaweicloud.sdk.ocr.v1.model.*; public class
概述 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interf
File 参数解释:图片文件 约束限制:图片大小上限 5M 取值范围:不涉及 默认取值:不涉及 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 img_id String 图片id img_url String 图片url v1改成v3作为下载图片请求 状态码:
与image二选一。 图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 return_text_location
图片处理约束限制 操作限制 所有的图片处理操作均不会修改原图。 归档存储不支持图片处理。 深度归档存储不支持图片处理。 使用SSE-KMS服务端加密的OBS桶不能用做图片处理。 当前只有桶版本号为3.0的桶支持图片处理。桶版本号可以在对象存储服务控制台上,进入桶概览页后,在“基本信息”中查看。
获取识别结果 解读识别结果 识别结果后处理
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK
参数 取值范围 代码样例 value 调整图片锐化程度,取值范围为[50,399]。 50为最低的锐化效果,推荐最优取值为100。数值越大清晰度越高。但数值过高容易使图片不真实。 image/sharpen,100 设置锐化示例 将图片样式的锐化设置为100。 https://e-share
智能分类 功能介绍 智能分类识别服务可以一次性对同张图片中的多个卡证、票据进行检测和识别,并返回每个卡证、票据的类别及结构化数据。 应用场景 智能分类识别服务应用在身份认证、财务报销等多种场景,使用方便,有效提升数据录入效率。 场景一:卡证、发票混合识别 场景二:相同类型发票识别