检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
银行回单识别 功能介绍 支持对银行回单版式进行文字识别及键值对提取,实现高效的自动化结构化返回。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 约束与限制 支持JPEG、JPG、PNG、BMP、TIFF、PDF格式,多页PDF默认识别第一页。 图像
模板总览 预览分类器下面所有模板的状态,如果有模板的识别区未设置,则无法进行后续的评估。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并框选添加的多个模板的识别区,详情请见框选识别区。 删除模板 如果已创建的模板应用不再使用,您可以删除模板释放资源。 在“应
按订单的购买周期计费。 套餐包有效期为1年,到期不会自动顺延,请在有效期内使用完。 按照API调用次数收费,按次进行结算。 变更计费模式 支持变更为按需计费模式。 套餐包到期后或套餐包使用完后,如果没有及时续费或购买新的套餐包,系统将自动转为按需计费方式。 套餐包转按需 支持变更为套餐包计费模式。
处理”逻辑快速处理图片,也可以按左上角操作指标调整图片。 图1 定义预处理 右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向水平。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重
套餐包管理 设置套餐包剩余使用量预警 单击文字识别控制台-套餐包管理,或者单击“控制台”>“费用”>“我的套餐”,页面右上角的“剩余使用量预警”,在页面右上角开启套餐包的剩余使用量预警功能。 图2 剩余使用量预警1 图3 剩余使用量预警2 阈值类型:您可以根据实际需要,设置剩余使用量
板”下拉框中选择模板,对每个模板图片进行预处理。 图1 多模板定义预处理 在右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重
"receiver_phone" : "12345678901", "receiver_address" : "深圳市龙岗区坂田街道华为基地", "sender_name" : "生活用品用品专营店", "sender_phone" : "1234567890"
图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。 支持图像任意角度的水平旋转。 支持自动过滤浅色文字水印。 目前不支持复杂背景(如户外自然场景等)和文字扭曲图像的文字识别。 支持中英文以及部分繁体字、马来语、乌克兰语、印地语、
is not supported报错。 url 否 String 与image二选一。 图片大小不超过10MB,图片的URL路径目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。 续费 套餐包文字识别服务在到期后会自动转为按需计费。如果您想继续使用文字识别服务套餐包,需要为文字识别服务进行续费。续费包括手动续费和自动续费两种方式,您可以根据需求选择。了解更多关于续费的信息,请参见续费概述。 费用账单 您可以在“费用中心
标即可搜索该资源的账单。如:通用表格识别 PKG 1千 包年。 图2 选择资源名称 图3 查询资源账单 这里设置的统计维度为“按使用量”,统计周期为“按账期”,您也可以设置其他统计维度和周期,详细介绍请参见流水与明细账单。
"},表示Token无效,Token中缺少project信息。 OCR服务为项目级别服务,获取Token接口中,需填写scope参数,并设置为project,例如填写为cn-north-4,获取到北京四区域的Token。 父主题: 错误码类
医疗:化验单、报告单、药品说明书等。 物流海关:货运单、配送单等。 其他:成绩单、商超小票、支付凭证、账单等。 优势 简单智能 无需训练直接调用,自动输出结构化信息,简单高效。 多版式 不受版式数量影响,支持多版式卡证、票据,适用场景广泛。 多功能 键值对提取、表格识别与版面分析多功能支
照字段。 如果不确定哪些文字是参照字段,或是想快速评估模板效果的,可以跳过"框选参照字段"流程,当后台检测到模板没有配置任何参照字段时,会自动寻找合适的参照字段进行识别,此功能可以提高项目开发与验证的效率。 父主题: 常见问题
OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取推理结果,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。调用API时,需要用户网络可以访问公网。 您可以使用本文档提供文字识别服务API的描述、语
print(encoded_string) 运行时请确保文件路径 d:/demo.jpg 是正确的,并且文件确实存在于此路径下。部分 Windows 环境下字符编码的默认设置可能与代码不兼容,导致读取后的解码报错。这种情况下可以尝试将代码中的decode()修改为decode('utf-8')来匹配适合的字符编码。
类别 API 说明 智能文档解析 智能文档解析 对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。 通用类 通用表格识别 识别表格图片上的文字内容,并返回识别的结构化结果。 通用文字识别 识别图片上的文字内容,并返回识别的文字和坐标。
“分类模式”:打开“分类模式”开关时,单独对分类器的准确度进行评估。上传图片后,右侧会显示模板自动分类的结果,包括“模板ID”、“模板名”、“置信度”。关闭“分类模式”开关时,默认评估状态为端到端地对待识别图片自动分类并进行结构化识别。 上传在线图片 单击“在线URL”,切换至“在线URL”页
file from the OBS failed. "表示从OBS获取图片数据失败,请确保存储图片的OBS路径存在且可访问,如果路径存在,请确保设置OBS桶策略为公共桶。建议:不要使用跨区域的OBS路径,如果OBS与调用服务部署区域不属于用一个区域,建议本地下载图片后使用image的调用方式。
参数时默认为true,既默认图片中的字段为单朝向。 language 否 String 语种选择,未传入该参数时默认为中英文识别模式。参考华为云通用文字支持语种。 kv 否 Boolean 是否进行键值对(key-value)提取。若是,结果会以“kv_result”这一关键字返回。