检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OCR服务支持上传图片后直接导出结果吗 目前OCR服务不支持上传图片后直接导出结果,需要通过调用API的方式使用。具体操作请参考《文字识别服务快速入门》。 父主题: 产品咨询类
在“应用开发>上传模板图片”页面,输入多模板分类器的“名称”和“描述”。 图3 上传模板图片 然后上传模板图片,可选择新增模板配置。 新增模板配置 新增模板配置 默认进入“新增模板配置”页签。 图4 新增模板配置 单击添加多个模板,针对每个模板,选择模板类型,并且上传图片。 “上传图片”
进入“应用开发”页面,开始开发应用。 图1 应用开发 上传模板图片 在“应用开发>上传模板图片”页面,配置如下信息: 图2 上传模板图片 “模板名称”:输入模板名称。 “语种”:单击图片上方“语种”下拉选择框,选择模板对应的语种。不选择的情况下,默认为中英文。 “上传图片”:单击“上传图片”区域,或鼠标直接拖
云容器引擎-成长地图 | 华为云 文字识别 文字识别(Optical Character Recognition,简称OCR)以开放API的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片、扫描件或PDF、OFD文档中的打印字符识别成可编辑的文本
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64
使用OCR服务是否必须使用华为云存储图片 文字识别服务支持输入图片的base64编码或图片的url路径。 如果您使用图片的url路径,可以将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的图片url。 关于OBS的使用请参考配置OBS访问权限。 OCR识别OBS私有桶中的图片
使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并上传模板图片,详情请见上传模板图片。
使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并上传模板图片,详情请见上传模板图片。 定义预处理
化结果。支持对多种不同版式名片进行结构化信息提取。 VIN码识别 识别图片中的车架号信息,并将识别结果返回给用户。 电子面单识别 识别用户上传的电子面单图片中的文字内容,并将识别的结果返回给用户。 道路运输从业资格证识别 识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并完成评估模板步骤,详情请见评估. 操作步骤 在“应用开发>调用指南”页面完成
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成评估模板步骤,详情请见评估。 操作步骤 在“应用开发>评估”页面完成模板评估后,单击“下一步”
电子面单识别 OCR电子面单识别将于2025.02.18正式停售,为避免影响您目前的业务,请您及时进行相关迁移工作,详见停售公告。 功能介绍 识别用户上传的电子面单图片中的文字内容,并将识别的结果以JSON格式返回给用户。 图1 电子面单示例图 约束与限制 电子面单支持的版式以样例为准。 支
识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。 关于如何压缩图片,请参考以下代码。
登录华为云对象存储服务控制台,查看部署完成后,自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件。 图2 上传待识别发票 选择用于存放结果的“ocr-invoice-result-
) \ .build() def image_to_base64(imagepath): """ 将本地图片转化为base64编码 """ with open(imagepath, "rb") as bin_data:
如果您是一个开发工程师,熟悉代码编写,想要直接调用OCR服务,您可以参考《API参考》或《SDK参考》获取详情。 由浅入深学习 您可以参考成长地图,由浅入深学习使用OCR。
R通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功能。该方式无需编程,只需在网页端上传图片,即可体验识别效果。 开通OCR后,默认按API成功调用次数进行收费。API使用指导请参见使用流程简介。 使用OCR体验馆前,请先注册华为账号并开通华为云,并实名认证。
可以上传在线图片。 图3 评估分类器 本地上传图片 默认进入“本地上传”页签,根据自身需要选择打开“分类模式”开关,单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 “分类模式”:打开“分类模式”开关时,单独对分类器的准确度进行评估。上传图片
面,依次完成“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”步骤,单击“下一步”,进入“评估”页面。 本地上传图片 图2 评估模板 在“应用开发>评估”页面,默认进入“本地上传”页签。 单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。
true:返回文本块和单元格坐标; false:不返回。 未传入该参数时默认为false,即不返回。 return_confidence 否 Boolean 返回字段识别置信度,小数点后四位。可选值包括: true:返回字段置信度; false:不返回。 未传入该参数时默认为false,即不返回字段置信度。