检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
false:关闭单朝向模式 图片文字方向一致时,打开该开关可提升识别精度;图片文字方向不一致时,关闭该开关可支持多朝向文字识别。未传入该参数时默认为true,既默认图片中的字段为单朝向。 language 否 String 语种选择,未传入该参数时默认为中英文识别模式。参考华为云通用文字支持语种。
上传图片 功能介绍 上传图片入库。 URI POST /v1/koosearch/image/{img_id} 表1 路径参数 参数 是否必选 参数类型 描述 img_id 是 String 图片ID,格式为img-[0-9a-z]{32} 最小长度:1 最大长度:64 请求参数
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
详细指导 上传模板图片 在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照
功能体验与试用 文字识别(Optical Character Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
import com.huaweicloud.sdk.ocr.v1.region.OcrRegion; import com.huaweicloud.sdk.ocr.v1.*; import com.huaweicloud.sdk.ocr.v1.model.*; public class
File 参数解释:图片文件 约束限制:图片大小上限 5M 取值范围:不涉及 默认取值:不涉及 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 img_id String 图片id img_url String 图片url v1改成v3作为下载图片请求 状态码:
import com.huaweicloud.sdk.ocr.v1.region.OcrRegion; import com.huaweicloud.sdk.ocr.v1.*; import com.huaweicloud.sdk.ocr.v1.model.*; public class
OCR文字识别服务计费可以按照项目来分别计费吗 可以。 OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用进行分账。 详情请参考API接口文档里的Enterprise-Project-Id参数。 父主题: 计费FAQ
费,不执行不产生费用。 文字识别 OCR:提供在线文字识别服务,将图片或扫描件中的文字识别成可编辑的文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。 人证核身服务 IVS:将用户本人与身份证信息关联起来,应用人脸识别与文字识别等技术,对接权威数据库,
与image二选一。 图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 return_text_location
API是否可以混用 OCR服务支持批量识别吗 OCR服务识别结果可以转化为Word、TXT、pdf吗 如何获取图片base64编码 OCR的并发是多少 调用OCR服务的区域可以与OBS资源的区域不一致吗 识别身份证正反面总计调用几次接口 如何提高识别精度 如何提高识别速度 pdf转图片方法 是否支持从非华为云存储中读取图片
IVS进行人证核身,并将结果转存到OBS桶里。 文字识别 OCR和人证核身服务 IVS:提供证件识别和人证核身服务,识别用户上传的证件图片以及人脸图片核对,并将结果以JSON格式返回。 方案优势 支持场景多 支持身份证、行驶证、驾驶证、道路运输证、道路运输从业资格证五种证件的图片识别和人证核身服务,打通服务壁垒,提供更好的业务场景支持。
处理图片持久化 图片处理持久化支持将处理后的图片同步存储至指定的OBS桶中,方便下次直接访问处理后的图片,减少图片处理花费的时间,提升用户体验。 图片处理持久化目前仅支持通过接口调用模式使用。在图片处理请求接口中,以参数名=参数值的格式,发送图片处理持久化请求,具体参数说明如表1所示。
图片处理约束限制 操作限制 所有的图片处理操作均不会修改原图。 归档存储不支持图片处理。 深度归档存储不支持图片处理。 使用SSE-KMS服务端加密的OBS桶不能用做图片处理。 当前只有桶版本号为3.0的桶支持图片处理。桶版本号可以在对象存储服务控制台上,进入桶概览页后,在“基本信息”中查看。
产品咨询类 OCR服务支持上传图片后直接导出结果吗 OCR服务能否实时处理视频流中的文字 通用表格识别是否支持导出为excel格式 使用OCR服务是否必须使用华为云存储图片 OCR服务可以识别文本格式文件吗 接口返回时间较长,如何提高响应速度 OCR服务是否支持二维码识别 OCR服务是否支持离线使用
按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。 购买文字识别服务请参考如何选购合适的API。 如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。
获取图片内容 功能介绍 根据ID获取图片内容。 URI GET /v1/koosearch/image/{img_id} 表1 路径参数 参数 是否必选 参数类型 描述 img_id 是 String 图片ID,格式为img-[0-9a-z]{32} 最小长度:1 最大长度:64
local\test.xlsx", response) 使用PDF进行文字识别 本示例将PDF文件转换为图片,并调用网络图片识别API,获取识别结果。 前提条件 开通网络图片识别。 参考本地调用,安装OCR Python SDK。并执行pip install fitz命令和pip