检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何调用API 总览 开通服务 构造请求 认证鉴权 返回结果
自定义OCR 自定义OCR介绍 创建应用 通用单模板工作流 多模板分类工作流 字段类型 查看应用详情 常见问题
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估 调用指南 编辑应用 删除应用 父主题: 自定义OCR
企业项目管理 应用场景简介 创建企业项目 企业项目财务管理
错误码类 APIG.0301报错处理方法 APIG.0201报错处理方法 APIG.0101报错处理方法 APIG.0106报错处理方法 APIG.0308报错处理方法 APIG.0307报错处理方法 ModelArts.0212报错处理方法 ModelArts.4603、ModelArts
权限类 使用OCR服务需要的权限 如何通过主账号创建IAM账号 无权在控制台服务监控查看数据
pdf转图片方法 # -*- coding: utf-8 -*- import os import base64 import fitz import io from PIL import Image from glob import glob class CovertPdfToJpg:
响应超时异常 CallTimeoutException 单次请求,服务器处理超时未返回。 RetryOutageException 在重试策略消耗完成后,仍无有效的响应。 ServiceResponseException 服务器响应异常 ServerResponseException 服务端内部错误,Http响应码:[500
和终端节点中查询所有服务的终端节点。 文字识别的终端节点如表1所示,请您根据业务需要选择对应区域的终端节点。 业务的服务器部署区域与OCR服务区域不一致,只要服务器可以访问公网,即可使用OCR服务。一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。
在“应用开发>评估”页面,您可以选择本地上传测试图片,也可以上传在线图片。 图3 评估分类器 本地上传图片 默认进入“本地上传”页签,根据自身需要选择打开“分类模式”开关,单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 “分类模式”:打开
Failed 未满足前提条件,服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息。
在配置文件或者环境变量中密文存放,使用时解密,确保安全。 本示例以 ak 和 sk 保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。 初始化客户端(二选一) 指定云服务region方式(推荐)
方案架构 图1 方案架构图 部署该解决方案会使用到如下资源: 创建用于上传发票的OBS桶,企业业务系统将员工报销的发票图片或者电子发票PDF文件上传到该桶。 创建用于存储发票识别与验真结果的OBS桶,企业业务系统定时从该桶中获取结果并处理。 函数工作流:用于实现调用文字识别服务的业务逻辑
几个方面进行排查:(1)请确保提供的URL支持HTTP/HTTPS请求协议,即格式为http/https url;(2)请检查存储图片的服务器是否稳定可靠,网络连接是否有异常,是否公网可访问;(3)请检查下载图片的content-type是否为标准类型,例如:image/gif、
y轴沿竖直方向。 confidence Float 文字块识别结果置信度信息,置信度越大,表示本次识别的对应字段的可靠性越大,在统计意义上,置信度越大正确率越高。注:置信度由算法给出,其不直接等价于对应字段的精度。 rows Array of integers 单元格行信息,列表形式。多个连续值表示单元格垮多行。
响应超时异常 CallTimeoutException 单次请求,服务器处理超时未返回。 RetryOutageException 在重试策略消耗完成后,仍无有效的响应。 ServiceResponseException 服务器响应异常 ServerResponseException 服务端内部错误,Http响应码:[500
配置客户端链接参数 默认配置 const client = ocr.OcrClient.newBuilder() 网络代理(可选) // 使用代理服务器(可选) client.withProxyAgent("http://username:password@proxy.huaweicloud
ject-token”就是需要获取的用户Token。获取Token之后,您就可以使用Token认证调用OCR服务API。 您还可以通过这个视频教程了解如何使用Token认证:https://bbs.huaweicloud.com/videos/101333 。 图1 获取Token示例
别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,详情请见创建应用。 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。
通用文字识别 功能介绍 识别图片上的文字信息,以JSON格式返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 支持中英文以及部分繁体字。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 通用文字示例图 约束与限制