检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区,使得矩形框覆盖待识别的文字。 框选识别区应尽量扩大识别区范围,使所框选识别区覆盖字段值可能出现的区域。 在右侧“框选识别区”中填写“框选字段”,选择“字段类型”。 “字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择的默认字段
统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重置图片为初始状态,即未进行任何处理的状态。 :单击图标,在“图片裁剪”窗口调整图片裁剪范围,然后单击“裁剪”,调整图片的大小。 :单击图标,在“图
单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区,使得矩形框覆盖待识别的文字。 框选识别区应尽量扩大识别区范围,使所框选识别区覆盖字段值可能出现的区域。 在右侧“框选识别区”中填写“框选字段”,选择“字段类型”。 “字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择的默认字段
智能文档解析 功能介绍 智能文档解析基于领先的深度学习技术,对任意含有结构化信息的文档图像进行键值对提取、表格识别与版面分析并返回相关信息。不限制版式情况,可支持多种证件、票据和规范行业文档,适用于各类行业场景。 应用场景 金融:银行回单、转账存单、理财信息截图等。 政务:身份证、结婚证、居住证、各类企业资质证照。
APIs切换步骤 V1版本APIs清单请参见表1。仅支持V2版本的API不在此表中列举。 在进行版本替换时,请在您的业务代码中搜索“v1.0”相关的API。例如,搜索“v1.0/ocr”找到代码中API请求地址所在的代码行。将“v1.0/ocr”替换为“/v2/{project_
理”逻辑快速处理图片,也可以按左上角操作指标调整图片。 图1 定义预处理 右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向水平。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重置
统计API使用量 文字识别控制台 > 服务监控支持查看API的总调用量、调用成功量、调用失败量。 如果您购买了套餐包,可在“套餐包管理”页面,查看已有的套餐包及使用详情。套餐包费用扣减规则请参见“产品介绍 > 计费说明”。 图1 服务监控
自动识别图片上的车架号信息。 泰文身份证识别 自动识别身份证上的全部信息,一次扫描即可识别身份证号码、姓名、地址等全部信息。 泰国车牌识别 识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。 道路运输从业资格证 自动识别道路运输从业资格证,根据不同版式内容返回对应的关键文字信息,可用于货运场景资质审核场景。
单独传递它,所以在此单独强调。 表1 URI中的参数说明 参数 说明 URI-scheme 表示用于传输请求的协议,当前所有API均采用HTTPS协议。 endpoint 指定承载REST服务端点的服务器域名或IP,不同服务不同区域的endpoint不同,您可以从终端节点章节查看。
"表示从URL获取图片数据失败,可通过以下几个方面进行排查:(1)请确保提供的URL支持HTTP/HTTPS请求协议,即格式为http/https url;(2)请检查存储图片的服务器是否稳定可靠,网络连接是否有异常,是否公网可访问;(3)请检查下载图片的content-type是否为标准类型,例如:im
您可以尝试以下方案进行解决。 Token有效期为24小时,请使用重新获取Token调用API。 检查接口URL中的终端节点是否填写正确。部署在不同区域间的服务,不可以跨区域调用。如果调用了不同区域的接口,导致判断为Token失效,显示APIG.0307错误码。 父主题: 错误码类
步骤二配置的环境选择认证鉴权的方式。 构造请求:Postman环境的构造请求请参考构造请求章节,SDK环境的API调用详见SDK参考。 除上述两种方式外,还可通过APIE在线调试的方式调用API,步骤如下。 开通服务后进入APIE界面。 选择已开通的服务和开通服务对应的Region。
获取账号ID 在调用接口的时候,部分URL中需要填入账号ID(domain-id),所以需要先在管理控制台上获取到账号ID。账号ID获取步骤如下: 注册并登录管理控制台。 单击用户名,在下拉列表中单击“我的凭证”。 在“我的凭证”页面的项目列表中查看账号ID。 图1 查看账号ID
IAM用户登录并验证权限 使用新创建的IAM账户登录控制台,切换至授权区域,进行验证权限。 假设IAM用户只具备“OCR ReadOnlyAccess”权限,即只读访问权限,使IAM用户仅具备使用服务能力,开通/关闭服务需要主账户操作。 进入OCR控制台界面,单击“开通服务”,如
文字识别控制台 在“我的应用”页签下,单击“创建应用”。 进入“创建应用”页面。 图2 创建应用 您也可以单击“我的工作流”,切换至“我的工作流”页签,选择工作流并单击卡片中的“创建应用”。 根据业务需求填写“应用名称”、“应用负责人”和“应用描述”,仅支持英文、中文、数字、下划线、中划线。选择“所属行业”及工作流。
Key(SK)。下载的访问密钥为credentials.csv文件,包含AK/SK信息。 图1 新增访问密钥 登录“我的凭证 ”页面,获取“IAM用户名”、“账号名”以及待使用区域的“项目ID”。调用服务时会用到这些信息,请提前保存。 本样例以“华北-北京四”区域为例,获取对应的项目ID(project_id)。
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
计费样例 计费场景 某用户于2023/03/18 15:30:00开通了华北-北京四的通用文字识别API。 成功调用5000次之后,用户发现此服务识别效果可以满足业务需求,因此打算长期使用下去,并于2023/03/20 10:30:00将通用文字识别转为套餐包计费(10万次套餐包,3
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
创建用于存储发票识别与验真结果的OBS桶,企业业务系统定时从该桶中获取结果并处理。 函数工作流:用于实现调用文字识别服务的业务逻辑,当OBS桶收到上传的发票文件后,会自动通知函数调用文字识别服务,并将结果存放到指定的OBS桶里。 文字识别服务:提供发票识别与验真服务,识别用户上传的发票内容以及对接国税局系统进行真伪验证。