已找到以下 274 条记录
产品选择
文字识别 OCR
没有找到结果,请重新输入
产品选择
文字识别 OCR
产品选择
没有找到结果,请重新输入
  • 网络图片识别 - 文字识别 OCR

    网络图片识别 功能介绍 识别网络图片文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别。 该接口支持字体分类功能,支持竖行文本识别。 该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 网络图片示例图 约束与限制 支持中英文及部分中文繁体字。

  • 上传模板图片 - 文字识别 OCR

    上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己业务需求制定针对性文字识别模型。例如上传两种不同格式发票图片作为模板,训练文字识别模型就能识别并提取这两种格式发票上关键字段。 前提条件

  • pdf转图片方法 - 文字识别 OCR

    page2pix(self, doc, page, trans): """ 根据给定参数,解析当前页作为图片数据 """ # 获取指定页面的pdf格式,注意:页面参数是事先解析出来,不然会存在问题。 return doc[page].getPixmap(matrix=trans

  • 身份证识别 - 文字识别 OCR

    支持图像中身份证任意角度水平旋转。 支持少量扭曲,扭曲后图像中身份证长宽比与实际身份证相差不超过10%。 能处理反光、暗光等干扰图片但影响识别精度。 目前支持识别单张身份证正面或者反面。 支持居民身份证正反面同时识别,不支持存在两张及以上同面身份证图片识别。 调用方法 请参见如何调用API。

  • 通用表格识别 - 文字识别 OCR

    通用表格识别 功能介绍 识别表格图片文字内容,并将识别的结果以JSON格式返回给用户。返回结果将图片区域(words_region)划分为两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。该接口使用限制请参见约束与限制,详

  • 车牌识别 - 文字识别 OCR

    车牌识别 功能介绍 识别输入图片车牌信息,并以JSON格式返回其坐标和内容。 该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 车牌示例图 支持车牌信息、车牌颜色识别,支持双行车牌识别,支持单张图片内多个车牌识别。 目前支持车牌类型含小型汽车

  • 通用文字识别 - 文字识别 OCR

    是否校正图片的倾斜角度,可选值如下。 true:校正图片倾斜角度 false:不校正图片倾斜角度 支持任意角度校正,未传入该参数时默认为“false”。 待识别图片如果存在倾斜,建议将此参数设置为“true”。 quick_mode 否 Boolean 快速模式开关,针对单行文字图片(要求图片只包含一行文字,

  • 图片质量类报错处理办法 - 文字识别 OCR

    图片质量类报错处理办法 问题现象 调用文字识别API时,产生以下图片质量类报错。 错误码AIS.0102:图片格式不支持。 错误码AIS.0103:图片尺寸不满足要求。 错误码AIS.0104:非支持图片类型或图片质量差。 解决方法 请参考产品介绍 > 约束与限制章节检查图片格式、像素是否符合规范。

  • 防疫健康码识别 - 文字识别 OCR

    与image二选一。 图片URL路径,目前仅支持华为云上OBS提供匿名公开授权访问URL以及公网URL。 detect_direction 否 Boolean 校正图片倾斜角度开关,可选值如下所示: true:校正图片倾斜角度 false:不校正图片倾斜角度 支持任意角度校正,未传入该参数时默认为“false”。

  • 解读识别结果 - 文字识别 OCR

    解读识别结果 本章节通过网络图片识别API介绍如何解读调API返回JSON格式识别结果。请参照API参考“响应参数”章节比对查看。 以下图识别结果为例,讲解图片内容如何与API返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含

  • 驾驶证识别 - 文字识别 OCR

    驾驶证识别 功能介绍 识别驾驶证图片中主页与副页文字内容,并将识别的结果以JSON格式返回给用户。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 驾驶证示例图 图2 电子驾驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制

  • 上传模板图片 - 文字识别 OCR

    需要定制识别的字段。例如上传某一格式发票图片作为模板,配置文字识别模型就能识别并提取同格式发票上关键字段。 前提条件 已在“自定义OCR”控制台选择“通用单模板工作流”创建应用,详情请见6.2新建应用。 提前准备待识别图片图片要求请见图片要求。 图片要求 保证图片质量:不

  • 行驶证识别 - 文字识别 OCR

    行驶证识别 功能介绍 识别行驶证图片中主页和副页文字内容,并将识别的结果以JSON格式返回给用户。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 行驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆行驶证的识别。

  • 如何获取图片base64编码 - 文字识别 OCR

    如何获取图片base64编码 OCR服务输入图片参数是图片base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线图片转base64工具。 使用时,需要将代码d:\demo.jpg替换为实际图片路径。 import base64

  • 工作流介绍 - 文字识别 OCR

    在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片方向,进而在正确方向上,识别图片中

  • 工作流介绍 - 文字识别 OCR

    上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片方向,进而在正确方向上,识别图片结构化信息。 框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。 框选识别区

  • 名片识别 - 文字识别 OCR

    IFF格式图片。 图像各边像素大小在15px到8192px之间。 图像中名片有效占比超过60%,保证整张名片内容包含在图像内。 支持图像中名片任意角度水平旋转(需开启方向检测)。 能处理反光、暗光、防伪标识等干扰图片但影响识别精度。 调用方法 请参见如何调用API。 前提条件

  • 手写文字识别 - 文字识别 OCR

    Boolean 是否校正图片倾斜角度,可选值如下。 true:校正图片倾斜角度 false:不校正图片倾斜角度 支持任意角度校正,未传入该参数时默认为“false”。 待识别图片如果存在倾斜,建议将此参数设置为“true”。 响应参数 根据识别的结果,可能有不同HTTP响应状态码(status

  • 使用OCR服务是否必须使用华为云存储图片 - 文字识别 OCR

    使用OCR服务是否必须使用华为云存储图片 文字识别服务支持输入图片base64编码或图片url路径。 如果您使用图片url路径,可以将图片上传至华为云对象存储服务(OBS)中,使用OBS提供图片url。 关于OBS使用请参考配置OBS访问权限。 OCR识别OBS私有桶中图片时需要保证调用O

  • OCR服务支持上传图片后直接导出结果吗 - 文字识别 OCR

    OCR服务支持上传图片后直接导出结果吗 目前OCR服务不支持上传图片后直接导出结果,需要通过调用API方式使用。具体操作请参考《文字识别服务快速入门》。 父主题: 产品咨询类