检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
定义预处理 使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并上传模板图片,详情请见上传模板图片。
V1版本APIs切换至V2版指导 华为云文字识别OCR服务计划于2023/03/30 00:00下线退市V1版本APIs接口服务。届时V1版本的OCR接口将不可用,此次接口版本的升级涉及文字识别OCR服务所有的API接口,如能未及时进行版本切换,则无法使用产品服务。 接口转换过程
产品,详细介绍可查看智能文档解析。 常见问题 智能文档解析与自定义模板的区别? 智能文档解析无需客户自己制作模板。 智能文档解析提供三个主要功能,分别是键值对提取、表格还原和版面分析。其中键值对提取是指提取和识别文档中存在关联的键值对信息,比如在合同文档中提取甲方-XX有限公司、
框选参照字段 在识别文字的过程中,套件会先对图片进行模板分类,再检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了正确分类并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于
上传模板图片 在使用单模板工作流开发应用之前,必须确保需要识别的图片都属于同一类型的模板。同一类模板的图片,它们有相同的版面排布,且要识别的文字类型和位置均要求固定。如果您的图片具有多种模板,请考虑使用“多模板工作流”。 确认模板类型后,要准备一张文字清晰的图作为模板图片,模板图
识别结果容易漏字或多识别出内容怎么办? 识别结果是根据识别区来进行提取的,识别区的位置和大小均会影响识别结果。 若结果漏字,可能是由于识别区太小导致的,需在相应模板的"框选识别区"页面,把漏字的识别区调大一些。 若多识别出文字,可能是识别区太大,将周边无关的文字也框进来了,需将识别区改小一点。
name分别指的是什么 user name指用户名称,domain name指用户所属的账号名称。如果使用账号获取token,账号的user name和domain name相同。如果使用IAM用户获取token(账号可以创建多个IAM用户),user name和domain name不相同,user
企业项目ID。OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用,进行分账。 获取方法:进入“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterprise-Project-Id(企业项目ID)。 企业项目创建步骤请参见用户指南。 说明: 创建企业项目后,在传参时,有以下三类场景。
什么情况下可以使用自定义模板? 自定义模板是一款用于提取卡证、票据和文档图片中自定义区域信息的文字识别产品。当您要识别的证件或票据种类不在华为云OCR API支持之中,并且识别图片的版式固定,则可以使用本产品提取自定义版式、自定义区域的文字信息。比如,目前华为云尚未推出毕业证书识
ssl_ca_cert 客户端连接参数配置完成后需在初始化客户端client中配置“with_http_config(config)”相应的代码,详情请参见4.初始化客户端(二选一)中的client后的代码。 配置认证信息 配置AK、SK、project_id信息。华为云通过AK识别用户的身份,
支持获取账号Token。建议为您自己创建一个IAM用户,获取IAM用户的Token。详细说明请参见帐密报错。 Token可通过调用“获取用户Token”接口获取,调用本服务API需要project级别的Token,即调用获取用户Token接口时,请求body中“auth.scop
通过阅读本文,您可以快速了解文字识别OCR的计费模式、计费项、续费、欠费等主要计费信息。 计费模式 文字识别提供按需计费和套餐包计费两种计费模式,以满足不同场景下的用户需求。按需计费是一种后付费模式,即先使用再付费,按照文字识别服务实际调用次数计费。套餐包计费是一种预付费模式,即先付费再使用,按照订单的购
错误码类 APIG.0301报错处理方法 APIG.0201报错处理方法 APIG.0101报错处理方法 APIG.0106报错处理方法 APIG.0308报错处理方法 APIG.0307报错处理方法 ModelArts.0212报错处理方法 ModelArts.4603、ModelArts
Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》。 OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》。
自定义模板OCR取消开通后,是否会将之前创建好的模板删除? 自定义模板OCR取消开通后,模板不会被删除,后期如果需要再次使用可以开通后继续使用即可。 父主题: 常见问题
步骤3:Token认证鉴权 Token是用户的访问令牌,承载了用户的身份、权限等信息,用户调用API接口时,需要使用Token进行鉴权。 在Postman左侧导航栏中单击“get-token”配置文件。 单击“Body”配置项。 图3 Token认证鉴权 填写华为云用户名、密码、账号名、项目部署区域。
监控安全风险 OCR提供基于云监控服务CES的监控能力,帮助用户监控账号下的OCR服务API,执行自动实时监控、告警和通知操作。用户可以实时掌握API所产生的调用成功次数、调用失败次数等信息。 关于OCR支持的监控指标,以及如何创建监控告警规则等内容,请参见监控。 同时,OCR控
单页字符数不大于1800,以获得较优的识别效果。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文档解析。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 通用表格识别 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到8192px之间。