检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK
名称和区域。 图1 资源名称和区域 单击左侧导航栏的图标,选择“人工智能 > 文字识别 OCR”。 进入文字识别“总览”页面。 选择资源所在的“区域”,单击对应的类别,进入产品列表。 单击对应产品操作列的“开通管理”,在对应账号的操作列单击“取消服务”。 图2 取消服务 按需计费
false:关闭单朝向模式 图片文字方向一致时,打开该开关可提升识别精度;图片文字方向不一致时,关闭该开关可支持多朝向文字识别。未传入该参数时默认为true,既默认图片中的字段为单朝向。 language 否 String 语种选择,未传入该参数时默认为中英文识别模式。参考华为云通用文字支持语种。
概述 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interf
API是否可以混用 不建议混用,例如有专门的身份证识别,就不建议使用“通用文字识别”识别身份证图片,不同接口底层算法不同,混用会导致识别效果差。 父主题: API使用类
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
OCR文字识别服务计费可以按照项目来分别计费吗 可以。 OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用进行分账。 详情请参考API接口文档里的Enterprise-Project-Id参数。 父主题: 计费FAQ
保留,且文字识别服务的运行不受影响。文字识别服务到期后的状态说明,请参见到期后影响。 续费相关的功能 套餐包文字识别服务续费相关的功能如表1所示。 表1 续费相关的功能 功能 说明 手动续费 套餐包文字识别服务从购买到套餐包截止日期之前,您可以随时在OCR控制台为文字识别服务续费,以延长文字识别服务的使用时间。
只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。 如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。 续费 套餐包文字识别服务在到期后会自动转为按需计费。如果您想继续使用文字识别服务套餐包,需要为文字识别服务进行续费。续费包括
提取图片中的文字暗水印(文件地址版本) 功能介绍 对指定存储地址信息(目前支持OBS)的已嵌入文字暗水印的图片提取文字暗水印,支持的图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *.dib, *.rle, *.tiff, *.tif, *.ppm
寻找节约成本的机会。您还可以根据成本分析阶段的分析结果识别成本偏高的资源,通过云监控服务监控资源的使用情况,确定成本偏高的原因,然后采取针对性的优化措施。 计费模式优化 不同类型的业务对资源使用周期有不同的要求,为每一类业务确定合适的计费模式,灵活组合以达到最优效果。 针对长期稳定的成熟业务,使用套餐包计费模式。
监控 文字识别的监控指标 查看监控指标
资源和成本规划 该解决方案主要部署如下资源,需要的产品列表和配置示例如表1、表2所示,以下花费仅供参考。 表1 产品配置说明 产品 配置示例 文字识别服务 区域:华北-北京四 计费模式:按需计费 涉及服务:增值税发票识别、发票验真 对象存储服务 区域:华北-北京四 计费模式:按需计费
准备工作 开通文字识别服务 登录文字识别控制台。 在控制台左上角选择区域为“北京四”,并开通“增值税发票识别”、“发票验真”。 开通后,默认为按需计费。 图1 开通管理 完成文字识别对OBS服务授权。 在文字识别控制台,选择“服务授权”,单击开通授权。 图2 服务授权 创建 rf_amdin_trust
按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。 购买文字识别服务请参考如何选购合适的API。 如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。
某用户于2023/03/18 15:30:00开通了华北-北京四的通用文字识别API。 成功调用5000次之后,用户发现此服务识别效果可以满足业务需求,因此打算长期使用下去,并于2023/03/20 10:30:00将通用文字识别转为套餐包计费(10万次套餐包,3,200元),购买时长为
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
如何获取图片的base64编码 本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64 with open("d:\demo.jpg"
与image二选一 图片的URL路径,目前支持: 公网HTTP/HTTPS URL 华为云OBS提供的URL,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权。详情参见配置OBS服务的访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。