检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
url中不能存在中文字符,若存在,中文需要进行utf8编码。 return_text_location 否 Boolean 识别到的文字块的区域位置信息。可选值包括: true:返回各个文字块区域 false:不返回各个文字块区域 如果无该参数,系统默认不返回文字块区域。如果输入参数不是Boolean类型
受技术与成本多种因素制约,文字识别服务存在一些约束限制。 以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过
哥伦比亚身份证识别 功能介绍 识别哥伦比亚身份证中的文字信息,并将识别的结构化结果返回给用户。 约束与限制 支持哥伦比亚身份证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中身份证区域有效占比超过8
修订记录 发布日期 修订记录 2023-04-30 第一次正式发布。
修订记录 表1 修订记录 发布日期↵ 修订记录↵ 2022-03-30 第一次正式发布。↵ 2023-03-08 修订实施步骤。 2024-08-22 适配函数工作流EventGrid触发器。
准备工作 开通文字识别服务 登录文字识别控制台。 在控制台左上角选择区域为“北京四”,并开通“增值税发票识别”、“发票验真”。 开通后,默认为按需计费。 图1 开通管理 完成文字识别对OBS服务授权。 在文字识别控制台,选择“服务授权”,单击开通授权。 图2 服务授权 创建 rf_amdin_trust
该解决方案主要部署如下资源,需要的产品列表和配置示例如表1、表2所示,以下花费仅供参考。 表1 产品配置说明 产品 配置示例 文字识别服务 区域:华北-北京四 计费模式:按需计费 涉及服务:增值税发票识别、发票验真 对象存储服务 区域:华北-北京四 计费模式:按需计费 存储策略:多AZ存储 桶策略:私有 存储类别:标准存储
无权在控制台服务监控查看数据 问题现象 用户进入控制台服务监控页面,选择产品显示为空,不能查看对应数据。 图1 服务监控 原因分析 此用户没有服务监控查看权限。 解决措施 用户没有服务监控查看权限,可以申请主账号为此IAM用户开通对应的服务,或者授予权限即可,具体操作如下: 登录
实时语音识别 前提条件 确保已按照配置Python环境配置完毕,Python SDK仅支持Python3。 确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。 请参考SDK(websocket)获取最新版本SDK包。 初始化Client 初始化RasrClient详见表
表4 文字识别输出参数说明 参数 说明 识别文字块列表 识别文字块列表,输出顺序从左到右,先上后下。 文字 文字。 文字块的区域位置 文字块的区域位置。 文字块识别结果 文字块识别结果。 图片朝向 图片朝向。 检测到的文字块数目 检测到的文字块数目。 身份证识别 识别身份证图片
快速卸载 快速卸载前请确认OBS桶中无文件,否则会导致删除失败。 解决方案部署成功后,单击该方案堆栈后的“删除”。 图1 一键卸载 在弹出的删除堆栈确认框中,输入方案的堆栈名称,单击“确定”,即可卸载解决方案。 图2 删除堆栈确认 父主题: 实施步骤
实施步骤 准备工作 自动化部署步骤 开始使用 快速卸载 父主题: 发票识别与验真
对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。 通用类 通用表格识别 识别表格图片上的文字内容,并返回识别的结构化结果。 通用文字识别 识别图片上的文字内容,并返回识别的文字和坐标。 网络图片识别 识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别。
使用SDK(Python) Python开发环境配置 媒资图像标签示例 名人识别示例 主体识别示例 翻拍识别示例 图像标签示例
快速卸载 解决方案部署成功后,单击该方案堆栈后的“删除”。 图1 一键卸载 在弹出的删除堆栈确认框中,输入Delete,单击“确认”,即可卸载解决方案。 图2 删除堆栈确认 父主题: 实施步骤
通过华为云控制台使用 登录华为云对象存储服务控制台,查看部署完成后,自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件。 图2 上传待识别发票 选
续费简介 套餐包文字识别服务到期后会影响文字识别服务正常运行。如果您想继续使用,需要在指定的时间内为文字识别服务续费,否则资源会自动释放,数据丢失且不可恢复。 续费操作仅适用于套餐包文字识别服务,按需计费文字识别服务不需要续费,只需要保证账户余额充足即可。 文字识别服务在到期前续费
某用户于2023/03/18 15:30:00开通了华北-北京四的通用文字识别API。 成功调用5000次之后,用户发现此服务识别效果可以满足业务需求,因此打算长期使用下去,并于2023/03/20 10:30:00将通用文字识别转为套餐包计费(10万次套餐包,3,200元),购买时长为1
cribe 取消开通通用文字识别服务 √ × ocr:generalText:getSubscribeUserList 查询开通通用文字识别的用户列表 √ √ ocr:generalText:subscribeAllUsers 为其余子用户开通通用文字识别服务 √ × ocr:g
OCR文字识别服务计费可以按照项目来分别计费吗 可以。 OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用进行分账。 详情请参考API接口文档里的Enterprise-Project-Id参数。 父主题: 计费FAQ