检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
作”列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 在“模板列表”页签,选择模板名称,单击操作列的“删除”。 弹出“确认删除”对话框。 图2 删除模板 单击“确认”,删除模板。 父主题: 通用单模板工作流
列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 在“分类器列表”页签,选择多模板名称,单击操作列的“删除”。 弹出“确认删除”对话框。 图2 删除分类器 单击“确认”,删除分类器。 父主题: 多模板分类工作流
单击待识别文字的左上角,移动鼠标框选识别区。 在右侧“框选识别区”中的“字段类型”下拉框中,单击“创建新字段类型”。 弹出“创建字段类型”对话框。 填写字段类型信息。 图1 创建字段类型 “字段类型名称”:填写待创建的字段类型名称,如识别身份证照片,可新增字段类型“出生日期”。
票上的关键字段。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,详情请见创建应用。 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。 数据要求 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 图片最大边不大于4
如果已创建的模板应用不再使用,您可以删除模板释放资源。 在“应用开发>模板总览”页面,选择“模板”,单击操作列的“删除”,弹出“确认删除”对话框,单击“确认”,删除模板。 父主题: 多模板分类工作流
片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 detect_direction 否 Boolean 是否校正图片的倾斜角度,可选值如下。 true:校正图片的倾斜角度
的配置信息进行编辑,通用单模板工作流操作指引请见工作流介绍,多模板工作流操作指引请见工作流介绍。 “删除”:单击“删除”,弹出“确认删除”对话框,单击“确认”,删除当前模板。 在“应用资产>自定义字段类型”页面下,可以查看自己定义的字段类型,也可单击“创建字段类型”,在此处创建新的字段类型,详情请见自定义字段类型。
受技术与成本多种因素制约,文字识别服务存在一些约束限制。其中系统级约束限制,是所有子服务的约束。除系统级约束限制外,各子服务还有独立的约束条件。 智能文档解析 支持中英文及部分中文繁体字。 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片以及PDF文档,PDF只
片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 detect_direction 否 Boolean 是否校正图片的倾斜角度,可选值如下。 true:校正图片的倾斜角度
片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 single_orientation_mode 否 Boolean 单朝向模式开关。可选值包括: true:打开单朝向模式
片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 return_text_location 否 Boolean 返回文本块坐标及单元格坐标信息,可选值包括:
解决方法 请参考产品介绍 > 约束与限制章节检查图片的格式、像素是否符合规范。 请检查图片的base64编码是否完整。 请检查图片质量,图片中文字是否清晰,肉眼可识别。 请检查API功能是否和输入的图片匹配。 父主题: 错误码类
什么是文字识别 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming I
错误码 调用接口出错后,将不会返回结果数据。调用方可根据每个接口对应的错误码来定位错误原因。当调用出错时,HTTPS请求返回一个 4xx 或 5xx 的 HTTPS状态码。返回的消息体中是具体的错误代码及错误信息。在调用方找不到错误原因时,可以联系华为云客服技术支持,并提供错误码,以便尽快帮您解决问题。
片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 quick_mode 否 Boolean 快速模式开关,针对单行文字图片(要求图片只包含一行文字,且文字区
准备数据 数据要求 受技术与成本多种因素制约,文字识别服务存在一些约束限制。 以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到8192px之间。
下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不建议存在中文字符,若存在,中文需要进行utf8编码。 advanced_mode 否 Boolean 默认为false,如果传参为true,则返回更多字段,具体请参见表5。
开通文字识别服务 OCR服务提供的开通方式有以下两种,用户可以任选其一进行开通服务。 按需计费开通服务 进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,执行开通操作,默认的计费方式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为“已开通”。
数据保护技术 OCR服务处理以下类型的数据: OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取的文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性,保障客户在使用OCR服务时数据安全。
pdf转图片方法 # -*- coding: utf-8 -*- import os import base64 import fitz import io from PIL import Image from glob import glob class CovertPdfToJpg: