已找到以下 10000 条记录
AI智能搜索
产品选择
全部
没有找到结果,请重新输入
产品选择
全部
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 如何获取图片base64编码 - 人脸识别服务 FRS

    如何获取图片base64编码 本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线图片转base64工具。 使用时,需要将代码d:\demo.jpg替换为实际图片路径。 import base64 with open("d:\demo.jpg"

  • 提取图片文字暗水印(文件地址版本) - 数据安全中心 DSC

    提取图片文字暗水印(文件地址版本) 功能介绍 对指定存储地址信息(目前支持OBS)已嵌入文字暗水印图片提取文字暗水印,支持图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *.dib, *.rle, *.tiff, *.tif, *.ppm

  • 如何在含有多张人脸图片中实现多人脸识别 - 人脸识别服务 FRS

    如何在含有多张人脸图片中实现多人脸识别 当前人脸识别服务中,如果传入图片中包含多个人脸,则只能选取最大一个人脸进行识别。但是可以使用如下方法,实现一张图片中多张人脸识别(比对/搜索): 调用人脸检测接口,可以得到多张人脸在图片像素位置。 通过获取到的人脸位置信息,从原

  • 评估应用 - 企业级AI应用开发专业套件 ModelArts Pro

    图片区域,上传本地图片作为测试图片。 上传图片后,右侧会显示文字识别结果,包括“识别区”和对应识别结果”。 上传在线图片 单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线图片作为测试图片。

  • 财务报表识别 - 文字识别 OCR

    财务报表识别 功能介绍 识别用户上传表格图片文字内容,并将识别的结果返回给用户。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。

  • VIN码识别 - 文字识别 OCR

    VIN码识别 功能介绍 识别图片车架号信息,并将识别结果以JSON格式返回给用户。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 VIN码示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边像素大小在15px到4096px之间。

  • 识别结果后处理 - 文字识别 OCR

    l\test.xlsx", response) 使用PDF进行文字识别 本示例将PDF文件转换为图片,并调用网络图片识别API,获取识别结果。 前提条件 开通网络图片识别。 参考本地调用,安装OCR Python SDK。并执行pip install fitz命令和pip install

  • 定额发票识别 - 文字识别 OCR

    定额发票识别 功能介绍 识别定额发票中文字信息,并以JSON格式返回识别的结构化结果。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 定额发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。

  • 附录 - AI

    基本概念、云服务简介、专有名词解释: 文字识别服务 OCR:文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中打印字符进行检测识别成可编辑文本格式,以JSON格式返回识别结果。 对象存储服务 OBS:对象存储服务(Object

  • 使用流程简介 - 文字识别 OCR

    OCR服务需要用户通过调用API接口,将图片或扫描件中文字识别成可编辑文本,然后返回JSON格式识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明。 文字识别服务等级协议请参见华为云服务等级协议。

  • 泰国车牌识别 - 文字识别 OCR

    泰国车牌识别 功能介绍 识别泰国车牌图片车牌信息,返回识别结果和车牌区域位置信息。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 泰国车牌示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边像素大小在15到8192px之间。

  • 银行卡识别 - 文字识别 OCR

    银行卡识别 功能介绍 识别银行卡上关键文字信息,并以JSON格式返回识别的结构化结果。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 银行卡示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别JPG、JPEG、PNG、BMP、TIFF格式图片。

  • 火车票识别 - 文字识别 OCR

    火车票识别 功能介绍 识别火车票中文字信息,并以JSON格式返回识别的结构化结果。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 火车票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。

  • 如何提高识别速度 - 文字识别 OCR

    如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程时间,因此建议在图片文字清晰情况下,适当压缩图片大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类小图(文字少)在1M以下,A4纸大小密集文档大图在2M以下。

  • 票据类 - 文字识别 OCR

    票据类 功能介绍 增值税发票识别 通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段,快速将增值税发票上文字信息识别出来,用于后续进一步处理,节省大量的人工录入成本。 机动车销售发票识别 自动识别机动车销售发票图片文本内容,并返回结构化字

  • 文字识别套件 - 企业级AI应用开发专业套件 ModelArts Pro

    文字识别套件 文字识别套件基于丰富文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求文字识别服务,实现多种版式图像文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片文字,提供高精度文字识别模型,保证结构化信息提取精度。

  • 电子面单识别 - 文字识别 OCR

    电子面单识别 功能介绍 识别用户上传电子面单图片文字内容,并将识别的结果以JSON格式返回给用户。 图1 电子面单示例图 约束与限制 电子面单支持版式以样例为准。 支持识别JPG、PNG、BMP、TIFF格式图片。 图像各边像素大小在15px到8192px之间。 调用方法

  • OCR服务支持批量识别吗 - 文字识别 OCR

    OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类

  • 方案概述 - AI

    FunctionGraph,用于实现调用文字识别服务业务逻辑,当收到OBS上传图片通知后,自动调用文字识别 OCR服务进行电子面单识别、网络图片识别并将结果存放在OBS桶内。 使用文字识别 OCR,提供电子面单识别和网络图片识别。用户只需要将电子面单图片或含有收/寄件信息截图上传至OBS桶,即可自动识别提取收/

  • 出租车发票识别 - 文字识别 OCR

    出租车发票识别 功能介绍 识别出租车发票中文字信息,并以JSON格式返回识别的结构化结果。该接口使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 出租车发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、J