检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
认证用的 ak 和sk 硬编码到代码中或者明文存储都有很大的安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 本示例以 ak 和 sk 保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。
认证用的 ak 和 sk 硬编码到代码中或者明文存储都有很大的安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 本示例以 ak 和 sk 保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。
应用场景简介 OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用,进行分账。企业可以根据组织架构规划不同的企业项目,并为每个企业项目设置拥有不同权限的用户组和用户,多个企业项目之间相互独立,资源分开结算。 企业账号可申请开通企业项目。账号需要进行企业实名认证。如果企
户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理,包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统,虚拟防火墙、API网关和高级安全服务,各项云服务,租户数据,以及身份账号和密钥管理等方面的安全配置。 《华为云安全白皮
评估 模板总览过后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并已框选识别,详情请见模板总览。
Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。 前提条件 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费、冻结、被注销等异常状态。
自动扣费导致欠费后,账号将变成欠费状态,资源将陆续进入宽限期和保留期。 图1 按需计费OCR资源生命周期 欠费预警 系统会在每个计费周期后的一段时间对按需计费资源进行扣费。当您的账户被扣为负值时,我们将通过邮件、短信和站内信的方式通知到华为云账号的创建者。 欠费后影响 当您的账号
图像中发票区域有效占比超过80%。 支持图像中增值税发票任意角度的水平旋转。 图片中发票宽高比例与真实发票比例一致。 支持增值税专用发票、全电发票(不含行业类发票)和增值税普通发票(含电子普通发票),包括增值税普通发票中的卷式发票、通行费发票。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
计费项 计费说明 按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。 购买文字识别服务请参考如何选购合适的API。 如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。
OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取的文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性,保障客户在使用OCR服务时数据安全。 表1 OCR的数据保护手段和特性 数据保护手段 说明 传输加密(HTTPS)
对于开启公共读授权的OBS资源公网可访问,可支持跨区域调用,虽然使用比较方便,但若对于敏感的信息,例如个人的私有数据,存在泄露风险。建议您调用的文字识别服务和OBS服务是在同一个区域。 父主题: API使用类
智能文档解析提供三个主要功能,分别是键值对提取、表格还原和版面分析。其中键值对提取是指提取和识别文档中存在关联的键值对信息,比如在合同文档中提取甲方-XX有限公司、金额-XX元、签署时间-20XX年X月等信息;表格还原指的是对文档中表格区域进行结构化识别并还原表格样式;版面分析指的是定位和识别文档的关键结构化信息
单击“创建分类器”。 进入“应用开发”页面,开始开发应用。 图2 创建分类器 填写基本信息 在“应用开发>上传模板图片”页面,输入多模板分类器的“名称”和“描述”。 图3 上传模板图片 然后上传模板图片,可选择新增模板配置。 新增模板配置 新增模板配置 默认进入“新增模板配置”页签。 图4 新增模板配置
见OCR自定义模板下线公告。 自定义OCR基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 工作流 自定义OCR当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高
准备数据 数据要求 受技术与成本多种因素制约,文字识别服务存在一些约束限制。 以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到8192px之间。
除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别:提取图片内的文字及其对应位置信息。 手写文字识别:识别手写文字、印刷文字信息。 网络图片识别:识别网络图片内的所有文字及其对应位置信息。
文字识别服务套餐包,需要为文字识别服务进行续费。续费包括手动续费和自动续费两种方式,您可以根据需求选择。了解更多关于续费的信息,请参见续费概述。 费用账单 您可以在“费用中心 > 账单管理”查看与文字识别相关的流水和明细账单,以便了解您的消费情况。如需了解具体操作步骤,请参见费用账单。
的数据安全风险。 适用计费项 按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数和计费,其中返回的2xx状态码表示调用成功,调用失败不计次数和计费。 计费周期 套餐包OCR资源的计费周期是根据您购买的时长来确定的(以UTC+8时间为准)。一个计费周期的
自定义模板支持识别单模板应用或是多模板应用,单模板仅支持一种版式,多模板支持识别多种版式。 单模板的前提: 识别图片需与模板图片版式相同,具体而言,图片中要存在文字内容和位置均固定不变的文字(参照字段)。 识别文字内容不能偏离设定的识别区域,包括打印偏移、由上下文长度变化引起的偏移等。 多模板的前提: 分类器
OCR),支持增值税发票、机动车销售发票、医疗发票等各种发票和表单图片上有效信息的自动识别和结构化提取。 行业类 OCR 行业类OCR(Domain OCR),支持物流面单、医疗化验单据等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。 首次使用OCR 如果您是首