已找到以下 10000 条记录
AI智能搜索
产品选择
全部
没有找到结果,请重新输入
产品选择
全部
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 如何获取图片base64编码 - 人脸识别服务 FRS

    如何获取图片base64编码 本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线图片转base64工具。 使用时,需要将代码d:\demo.jpg替换为实际图片路径。 import base64 with open("d:\demo.jpg"

  • 财务报表识别 - 文字识别 OCR

    财务报表识别 功能介绍 识别用户上传表格图片文字内容,并将识别的结果返回给用户。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。

  • 如何在含有多张人脸图片中实现多人脸识别 - 人脸识别服务 FRS

    如何在含有多张人脸图片中实现多人脸识别 当前人脸识别服务中,如果传入图片中包含多个人脸,则只能选取最大一个人脸进行识别。但是可以使用如下方法,实现一张图片中多张人脸识别(比对/搜索): 调用人脸检测接口,可以得到多张人脸在图片像素位置。 通过获取到的人脸位置信息,从原

  • 泰国车牌识别 - 文字识别 OCR

    泰国车牌识别 功能介绍 识别泰国车牌图片车牌信息,返回识别结果和车牌区域位置信息。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 泰国车牌示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边像素大小在15到8192px之间。

  • VIN码识别 - 文字识别 OCR

    VIN码识别 功能介绍 识别图片车架号信息,并将识别结果以JSON格式返回给用户。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 VIN码示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边像素大小在15px到4096px之间。

  • 定额发票识别 - 文字识别 OCR

    定额发票识别 功能介绍 识别定额发票中文字信息,并以JSON格式返回识别的结构化结果。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 定额发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。

  • 识别结果后处理 - 文字识别 OCR

    l\test.xlsx", response) 使用PDF进行文字识别 本示例将PDF文件转换为图片,并调用网络图片识别API,获取识别结果。 前提条件 开通网络图片识别。 参考本地调用,安装OCR Python SDK。并执行pip install fitz命令和pip install

  • 附录 - AI

    基本概念、云服务简介、专有名词解释: 文字识别服务 OCR:文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中打印字符进行检测识别成可编辑文本格式,以JSON格式返回识别结果。 对象存储服务 OBS:对象存储服务(Object

  • 使用流程简介 - 文字识别 OCR

    OCR服务需要用户通过调用API接口,将图片或扫描件中文字识别成可编辑文本,然后返回JSON格式识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明。 文字识别服务等级协议请参见华为云服务等级协议。

  • 银行卡识别 - 文字识别 OCR

    银行卡识别 功能介绍 识别银行卡上关键文字信息,并以JSON格式返回识别的结构化结果。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 银行卡示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别JPG、JPEG、PNG、BMP、TIFF格式图片。

  • 文字识别套件 - 企业级AI应用开发专业套件 ModelArts Pro

    文字识别套件 文字识别套件基于丰富文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求文字识别服务,实现多种版式图像文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片文字,提供高精度文字识别模型,保证结构化信息提取精度。

  • 电子面单识别 - 文字识别 OCR

    电子面单识别 OCR电子面单识别将于2025.02.18正式停售,为避免影响您目前业务,请您及时进行相关迁移工作,详见停售公告。 功能介绍 识别用户上传电子面单图片文字内容,并将识别的结果以JSON格式返回给用户。 图1 电子面单示例图 约束与限制 电子面单支持版式以样例为准。

  • 火车票识别 - 文字识别 OCR

    火车票识别 功能介绍 识别火车票中文字信息,并以JSON格式返回识别的结构化结果。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 火车票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。

  • 印章识别 - 文字识别 OCR

    多页PDF默认识别第一页,或者您可以指定要识别的页码。 图像各边像素大小在15px到8192px之间。 支持单图多印章识别。 支持图像中印章任意角度水平旋转。 支持圆形章、椭圆章、方形章、三角章和菱形章检测和识别。 能处理反光、暗光等干扰图片但影响识别精度。 调用方法 请参见如何调用API。

  • 如何提高识别速度 - 文字识别 OCR

    如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程时间,因此建议在图片文字清晰情况下,适当压缩图片大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类小图(文字少)在1M以下,A4纸大小密集文档大图在2M以下。

  • 票据类 - 文字识别 OCR

    票据类 功能介绍 增值税发票识别 通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段,快速将增值税发票上文字信息识别出来,用于后续进一步处理,节省大量的人工录入成本。 机动车销售发票识别 自动识别机动车销售发票图片文本内容,并返回结构化字

  • 如何选购合适API - 文字识别 OCR

    通用文字识别:提取图片文字及其对应位置信息。 手写文字识别识别手写文字、印刷文字信息。 网络图片识别识别网络图片所有文字及其对应位置信息。 证件类 身份证识别、护照识别、银行卡识别 驾驶证识别、行驶证识别、道路运输证识别、车牌识别、VIN码识别 营业执照识别、名片识别 票据类 增值税

  • OCR服务支持批量识别吗 - 文字识别 OCR

    OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类

  • 方案概述 - AI

    FunctionGraph,用于实现调用文字识别服务业务逻辑,当收到OBS上传图片通知后,自动调用文字识别 OCR服务进行电子面单识别、网络图片识别并将结果存放在OBS桶内。 使用文字识别 OCR,提供电子面单识别和网络图片识别。用户只需要将电子面单图片或含有收/寄件信息截图上传至OBS桶,即可自动识别提取收/

  • OCR服务可以识别文本格式文件吗 - 文字识别 OCR

    OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类