检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Boolean 可选值包括: true:输入图像仅包含有线表格,仅进行有线表格识别。 false: 输入图像可能包含无线表格,同时进行有线表格与无线表格识别。 未传入该参数时默认为false,即同时进行有线表格与无线表格识别。当确认输入仅包含有线表格时,该参数设为true可达到更优识别效果。 响应参数
result字段仅在API调用成功后返回。 words_block_count表示文字块识别结果,本示例中,识别出2个文字块,分别代表图片中的2行文字。 words_block_list表示文字块列表,按照图片文字从上到下、从左到右排列。 words为识别出来的文本内容,confidence表示该字段的置信度。
识别结果容易漏字或多识别出内容怎么办? 识别结果是根据识别区来进行提取的,识别区的位置和大小均会影响识别结果。 若结果漏字,可能是由于识别区太小导致的,需在相应模板的"框选识别区"页面,把漏字的识别区调大一些。 若多识别出文字,可能是识别区太大,将周边无关的文字也框进来了,需将识别区改小一点。
M为文字识别提供了用户认证和鉴权功能。 云监控 云监控(Cloud Eye)可以监控文字识别的相关指标,具体如表1所示。用户可以通过指标及时了解文字识别的使用情况。Cloud Eye的更多信息请参见《云监控用户指南》。 表1 OCR的监控指标 指标名称 指标含义 取值范围 测量对象
维度介绍成本管理,帮助您通过成本管理节约成本,在保障业务快速发展的同时获得最大成本收益。 成本构成 使用文字识别服务OCR时,成本主要包括两个方面: 资源成本:各类资源和资源包的成本,这取决于文字识别服务的计费项,详细介绍请参见计费项。 华为云成本中心可以帮助您更高效地管理资源成
如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.getenv("CLOUD_SDK_AK") sk = os.getenv("CLOUD_SDK_SK")
如果您是IAM用户,且您记得当前密码,可以在控制台页面,鼠标移动至右上方的用户名,在下拉列表中选择“安全设置”,进入“基本信息”页签修改您的用户密码。 忘记密码 通过登录页面的“忘记密码”功能自行修改密码,详情请参考:忘记密码怎么办。 如果您是IAM用户,还可以请管理员修改密码,适用于您没有绑定邮箱
常见问题 什么情况下可以使用自定义模板? 如何选取参照字段? 识别结果容易漏字或多识别出内容怎么办? 识别字符出现错误如何优化? 自定义模板OCR取消开通后,是否会将之前创建好的模板删除? 父主题: 自定义OCR
OBS服务授权 OCR服务开通后,可在控制台进行关闭。开通服务时,计费规则默认为“按需计费”。只有调用成功才会计费,其中返回的2xx状态码表示调用成功,调用失败不计费,详细的计费价格及规则请参见计费说明。 如未开通服务,直接调用OCR API会提示ModelArts.4204报错。
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
OCR的并发是多少 文字识别服务属于公有云服务,线上用户资源共享,并发量会根据线上用户的调用情况动态调整。 如遇到突发高峰导致的并发量不够用的情况,您可以尝试以下两种解决方法: 通过重试机制,在代码里检查返回值,碰到并发错误可以延时一小段时间(如2-5s)重试请求。 后端检查上一
AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。 Token认证 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限。
Array<Array<Integer>> 当前表格的位置信息,列表形式,分别表示文字块4个顶点的x, y坐标;坐标原点为图片左上角,x轴沿水平方向,y轴沿竖直方向。 words_block_count Integer 表格中所包含的单元格数量。 words_block_list Array of
Array<Array<Integer>> 表格位置信息,列表形式,分别表示表格4个顶点的x, y坐标;坐标原点为图片左上角,x轴沿水平方向,y轴沿竖直方向。 words_block_list Array of FinancialStatementWordsBlockList objects 区域内文字块列表,输出顺序从左到右,从上到下。
objects 被保人列表(第一个默认为主被保人)。 beneficiary_list Array of BeneficiaryItem objects 受益人列表。 insurance_list Array of InsuranceItem objects 保险项目信息列表。 表6 InsurancePolicyDetail
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result DriverLicenseResult object 识别结果。 调用失败时不返回此字段。 表5 DriverLicenseResult
页面。在“我的应用”页签下,选择应用并单击操作列的“查看”,进入应用详情页,可从“应用资产”和“应用开发”两个页签进入评估模板页面。 在“应用资产”页面,默认进入“分类器列表”页签,单击已有模板操作列的“评估”。进入“评估”页面。 图1 评估 在“应用开发”页面,依次完成“上传模
各个字段的置信度。 words_block_count Integer 代表检测识别出来的文字块数目。 words_block_list Array of HealthCodeWordsBlockList objects 识别文字块列表,输出顺序从左到右,从上到下。 表6 HealthCodeWordsBlockList
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result Array of LicensePlateResult objects 识别结果。 调用失败时不返回此字段。 表5 LicensePlateResult