检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
fmt.Println(err) } } 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 成功响应示例 400 失败响应示例 状态码请参见状态码。 错误码 错误码请参见错误码。
类别 API 说明 智能文档解析 智能文档解析 对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。 通用类 通用表格识别 识别表格图片上的文字内容,并返回识别的结构化结果。 通用文字识别 识别图片上的文字内容,并返回识别的文字和坐标。
参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。 套件提供了自动搜索参照字段和手动框选参照字段这两种模式。 自动搜索参照字段:未手动框选任何参照字段的情况下,默认激活自动搜索参照字段模式。 手动框选参照字段:若手动框选了任意参照字段,将激活手动框选模式。
参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。 套件提供了自动搜索参照字段和手动框选参照字段这两种模式。 自动搜索参照字段:未手动框选任何参照字段的情况下,默认激活自动搜索参照字段模式。 手动框选参照字段:若手动框选了任意参照字段,将激活手动框选模式。
续费 续费概述 手动续费 自动续费
问操作,以此实现云资源权限访问控制。管理员创建IAM用户后,需要将用户加入到一个用户组中,IAM可以对这个组授予OCR所需的权限,组内用户自动继承用户组的所有权限。 委托授权 如果用户想使用存储在对象存储服务(OBS)上的数据,他可以委托授权OCR服务访问对象存储服务。 父主题:
实施步骤 准备工作 自动化部署步骤 开始使用 快速卸载 父主题: 发票识别与验真
“分类模式”:打开“分类模式”开关时,单独对分类器的准确度进行评估。上传图片后,右侧会显示模板自动分类的结果,包括“模板ID”、“模板名”、“置信度”。关闭“分类模式”开关时,默认评估状态为端到端地对待识别图片自动分类并进行结构化识别。 上传在线图片 单击“在线URL”,切换至“在线URL”页
进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,在操作列单击“购买套餐包”,此时的计费方式采用套餐包计费,套餐包额度用完后自动转为按需计费。 图3 购买套餐包 服务开通成功后,开通状态将显示为“已开通”。 如果您需要调用对象存储服务(OBS)中的数据,请在开通服务页面进行服务授权。
板”下拉框中选择模板,对每个模板图片进行预处理。 图1 多模板定义预处理 在右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重
处理”逻辑快速处理图片,也可以按左上角操作指标调整图片。 图1 定义预处理 右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向水平。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图标重
Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》。 OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》。
识别异常成本。 成本优化 成本控制 企业可以在成本中心的“预算管理”页面创建精细粒度的预算来管理成本和使用量,在实际或预测超过预算阈值时,自动发送通知给指定消息接收人。企业还可以创建预算报告,定期将指定预算进展通知给指定消息接收人。 例如企业需要创建一个文字识别的按需成本预算,每
通过构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 多模板分类工作流 支持用户自定义多个文字识别模板,通过AI分类算法,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 使用工作流开发应用流程 自定义OCR提供了单模板工作流和多模板工作流
OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取推理结果,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。调用API时,需要用户网络可以访问公网。 您可以使用本文档提供文字识别服务API的描述、语
照字段。 如果不确定哪些文字是参照字段,或是想快速评估模板效果的,可以跳过"框选参照字段"流程,当后台检测到模板没有配置任何参照字段时,会自动寻找合适的参照字段进行识别,此功能可以提高项目开发与验证的效率。 父主题: 常见问题
识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中
fmt.Println(err) } } 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 成功响应示例 400 失败响应示例 状态码请参见状态码。 错误码 错误码请参见错误码。
用户使用Python、Java等编程语言调用OCR服务API将图片、扫描件或PDF、OFD文档中的打印字符识别成可编辑的文本格式,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。 产品介绍 在线体验 图说ECS 立即使用 成长地图 由浅入深,带您玩转OCR 01 了解
com 原因分析 调用服务对应终端节点下的项目ID没有生成。 解决措施 在“我的凭证”页面中查看对应终端节点的项目ID,确认系统中没有生成。 在OCR控制台将终端节点切换至调用服务所在的终端节点,之后前往“我的凭证”页面,即可查看到已生成对应的项目ID。 图1 终端节点 图2 项目ID