检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。对于多模板应用而言,参照字段还将用于区分不同的模板。 框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。 框选识别区
开通文字识别服务 OCR服务提供的开通方式有以下两种,用户可以任选其一进行开通服务。 按需计费开通服务 进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,执行开通操作,默认的计费方式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为“已开通”。
OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类
supported. 图片格式不支持,或image参数值不是base64编码字符串。 请检查图片格式,各服务支持图片格式请参考使用限制。 AIS.0103 The image size does not meet the requirements. 图片尺寸不满足要求。 请检查图片尺寸,各服务支持图片尺寸请参考使用限制。
数据保护技术 OCR服务处理以下类型的数据: OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取的文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性,保障客户在使用OCR服务时数据安全。
度。 通用单模板工作流 通过构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 多模板分类工作流 支持用户自定义多个文字识别模板,通过AI分类算法,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 使用工作流开发应用流程
按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。 购买文字识别服务请参考如何选购合适的API。 如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。
OCR服务支持上传图片后直接导出结果吗 目前OCR服务不支持上传图片后直接导出结果,需要通过调用API的方式使用。具体操作请参考《文字识别服务快速入门》。 父主题: 产品咨询类
您还可以通过这个视频教程了解如何使用Token认证:https://bbs.huaweicloud.com/videos/101333 。 图1 获取Token示例 图2 获取用户Token响应消息头 AK/SK认证 AK/SK签名认证方式仅支持消息体大小12M以内,12M以上的请求请使用Token认证。
目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具体请参考文字识别服务《SDK参考》手册,该手册详细介绍了SDK支持的版本及使用方法。 如果想用其他编程语言调用OCR API服务,可以使用Token鉴权方式,实现接口调用。具体请参考文字识别服务接口《A
使用OCR服务是否必须使用华为云存储图片 文字识别服务支持输入图片的base64编码或图片的url路径。 如果您使用图片的url路径,可以将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的图片url。 关于OBS的使用请参考配置OBS访问权限。 OCR识别OBS私有桶中的图片时需要保证调用
在文字识别控制台左侧导航栏选择“自定义OCR”。 默认进入“我的应用”页签。 图1 文字识别控制台 在“我的应用”页签下,单击“创建应用”。 进入“创建应用”页面。 图2 创建应用 您也可以单击“我的工作流”,切换至“我的工作流”页签,选择工作流并单击卡片中的“创建应用”。 根据业务需求填写“应用名称”、“应用负
本”进入“费用中心”。 选择“账单管理>流水和明细账单>明细账单”,在如下图所示位置,获取资源名称和区域。 图1 资源名称和区域 单击左侧导航栏的图标,选择“人工智能 > 文字识别 OCR”。 进入文字识别“总览”页面。 选择资源所在的“区域”,单击对应的类别,进入产品列表。 单
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
是否支持从非华为云存储中读取图片 OCR服务支持读取公网http和https的图片地址,如果使用非华为云存储,请确保相应的图片可以通过公网进行访问。 父主题: API使用类
态。 :单击图标,在“图片裁剪”窗口调整图片裁剪范围,然后单击“裁剪”,调整图片的大小。 :单击图标,在“图片旋转”窗口,鼠标选中调整图片的方向,然后单击“确认”,调整图片的方向。 :单击图标,向左旋转图片90°。 :单击图标,向右旋转图片90°。 :单击图标,缩小图片大小。 :单击图标,放大图片大小。
申请服务操作步骤参见文档为《文字识别API参考》。 2018-07-30 修改 删除银行卡识别、一维码识别、二维码识别和车牌识别相关内容。 2018-05-10 新增 银行卡识别服务的demo用例 一维码识别服务的demo用例 二维码识别服务的demo用例 车牌识别服务的demo用例 机动车销售发票识别的demo用例
求消息体中参数支持中文,则中文字符必须为UTF-8编码。 每个接口的请求消息体内容不同,也并不是每个接口都需要有请求消息体(或者说消息体为空),GET、DELETE操作类型的接口就不需要消息体,消息体具体内容需要根据具体接口而定。 例如,对于网络图片识别接口,您可以从接口的请求部
“订单管理>我的订单”进入“我的订单”页面。 在如下图所示位置,复制资源名称。 图1 获取资源名称 “账单管理> 流水和明细账单 > 明细账单”进入明细账单列表,在筛选条件中选择“资源名称”,并输入步骤2复制的资源名称:“通用表格识别 PKG 1千”。 名称末尾添加“包年”(订单周期)后,单击图标即可搜索该资源的账单。如:通用表格识别