检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持图像中行驶证任意角度的水平旋转。 支持少量扭曲,扭曲后图像中的行驶证长宽比与实际行驶证相差不超过10%。 能处理反光、暗光、防伪标识等干扰的图片但影响识别精度。 目前只支持识别2008年版的行驶证。 调用方法 请参见如何调用API。 前提条件 在使用之前,需要您完成服务申请和认证
的字段类型。 在“应用开发>框选识别区”页面单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区。 在右侧“框选识别区”中的“字段类型”下拉框中,单击“创建新字段类型”。 弹出“创建字段类型”对话框。 填写字段类型信息。 图1 创建字段类型 “字段类型名称”:填写待创建的
的url路径。 如果您使用图片的url路径,可以将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的图片url。 关于OBS的使用请参考配置OBS访问权限。 OCR识别OBS私有桶中的图片时需要保证调用OCR服务的账号和调用OBS服务的账号为同一个。 同时,您也可以不使用
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“通用单模
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“多模板分
不同服务不同区域的endpoint不同,您可以从终端节点中获取。 例如,OCR服务在“华北-北京四”区域的“endpoint”为“ocr.cn-north-4.myhuaweicloud.com”。 project_id 是 项目ID,您可以从获取项目ID中获取。 请求参数 表2 请求Header参数
图像各边的像素大小在100px到8192px之间。 图像中识别区域有效占比超过80%,保证整张发票及其边缘包含在图像内。 支持图像中发票任意角度的水平旋转。 支持少量扭曲,扭曲后图像中的发票长宽比与实际发票相差不超过10%。 调用方法 请参见如何调用API。 前提条件 在使用之前,需要您完成
参数 参数类型 描述 key String key-value对(键值对)中的key,例如“姓名:小明”中的“姓名” value String key-value对(键值对)中的value,例如“姓名:小明”中的“小明” words_block_count Integer 该键值对中所包含的文本框数量。
图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。 支持图像任意角度的水平旋转。 目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。 支持中英文以及部分繁体字。 调用方法 请参见如何调用API。 前提条件 在使用
Token header. The Token not contain project item. "},表示Token无效,Token中缺少project信息。 OCR服务为项目级别服务,获取Token接口中,需填写scope参数,并设置为project,例如填写为cn-no
OCR服务的SDK是否依赖于Maven管理依赖包 Python SDK依赖的部分包如requests等需要在本地环境中安装,在连通外网的情况下可直接使用pip install +包名安装。 Java SDK不需要使用Maven管理本地依赖包,可以直接运行使用。 父主题: SDK使用类
使用OCR服务需要的权限 使用OCR服务时,如果您需要使用华为云对象存储服务(OBS)中的数据,请开通对象存储服务OBS授权,可在控制台进行开通。 OCR服务支持IAM细粒度划分策略。可以为子用户设置OCR服务的使用权限。 父主题: 权限类
只支持识别PNG、JPG、JPEG、BMP、TIFF、PDF格式数据。 图像各边的像素大小在15px到8192px之间。 支持图像中票证任意角度的水平旋转。 PDF格式数据使用第一页作智能分类。 调用方法 请参见如何调用API。 前提条件 在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务和认证鉴权章节。
hours. 发票认证信息在税务机关信息中异常。 税局机关接口异常,请等候税局机关恢复后再重试,建议2小时后重试。 1007 This batch of invoices is being verified. 该批发票正在校验中。 该批次发票正在核验中,请第二天再查验。 1008 The
之间。 图像中发票区域有效占比超过80%。 支持图像中增值税发票任意角度的水平旋转。 图片中发票宽高比例与真实发票比例一致。 支持增值税专用发票、全电发票(不含行业类发票)和增值税普通发票(含电子普通发票),包括增值税普通发票中的卷式发票、通行费发票。 文字识别服务属于公有云服务
OCR服务使用简介 文字识别(Optical Character Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。 OCR以开放API(Application Programming Interface,应用程序
如果出现“Error:Header overflow”的标头溢出问题,可参考如下解决方案。 修改操作系统的环境变量。windows10系统中,需要鼠标右键单击“此电脑”,选择属性,在“高级 > 环境变量”中新建: 变量名NODE_OPTIONS 变量值--max-http-header-size=16384
0307",是因为Token失效,需要进行更新。 您可以尝试以下方案进行解决。 Token有效期为24小时,请使用重新获取Token调用API。 检查接口URL中的终端节点是否填写正确。部署在不同区域间的服务,不可以跨区域调用。如果调用了不同区域的接口,导致判断为Token失效,显示APIG.0307错误码。
如果委托不存在时执行接下来的步骤创建委托。 单击“委托”页面的“创建委托”。 在委托名称中输入“rf_admin_trust”,选择“普通账号”,委托的账号,输入“op_svc_IAC”,单击“下一步” 。 图4 创建委托 在搜索框中输入”Tenant Administrator”权限,并勾选搜索结果。
功能体验与试用 文字识别(Optical Character Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功