已找到以下 10000 条记录
AI智能搜索
产品选择
全部
没有找到结果,请重新输入
产品选择
全部
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 一句话识别Http接口 - 语音交互服务 SIS

    一句话识别Http接口 前提条件 确保已按照配置Python环境配置完毕,Python SDK仅支持Python3。 确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。 请参考SDK(websocket)获取最新版本SDK包。 初始化Client 初始化A

  • 财务报表识别 - 文字识别 OCR

    财务报表识别 功能介绍 识别用户上传的表格图片中的文字内容,并将识别的结果返回给用户。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像。 支持图像任意角度的水平旋转。

  • OCR服务可以识别文本格式文件吗 - 文字识别 OCR

    OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类

  • 新建敏感数据识别任务 - 数据安全中心 DSC

    在左侧导航树中,选择“敏感数据识别 > 识别任务”,进入识别任务界面,如图2所示。 图2 识别任务列表 单击“新建任务”,进入“新建任务”界面。 勾选数据类型并选择具体扫描资产名称,单击“确定”。 在新建识别任务界面左下角单击添加识别范围,进行扫描范围配置,可以同时添加多项识别范围,参数配置如表2所示。

  • 图解文字识别 - 文字识别 OCR

    图解文字识别

  • 印章识别 - 文字识别 OCR

    多页PDF默认识别第一页,或者您可以指定要识别的页码。 图像各边的像素大小在15px到8192px之间。 支持单图多印章识别。 支持图像中印章任意角度的水平旋转。 支持圆形章、椭圆章、方形章、三角章和菱形章的检测和识别。 能处理反光、暗光等干扰的图片但影响识别精度。 调用方法 请参见如何调用API。

  • 泰国车牌识别 - 文字识别 OCR

    泰国车牌识别 功能介绍 识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 泰国车牌示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。

  • 使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

    使用ModelArts Standard自定义算法实现手写数字识别 本文为用户提供如何将本地的自定义算法通过简单的代码适配,实现在ModelArts上进行模型训练与部署的全流程指导。 场景描述 本案例用于指导用户使用PyTorch1.8实现手写数字图像识别,示例采用的数据集为MNIST官方数据集。

  • 方案概述 - AI

    FunctionGraph,用于实现调用文字识别服务业务逻辑,当收到OBS上传图片通知后,自动调用文字识别 OCR服务进行电子面单识别、网络图片识别并将结果存放在OBS桶。 使用文字识别 OCR,提供电子面单识别和网络图片识别。用户只需要将电子面单图片或含有收/寄件信息的截图上传至OBS桶,即可自动识别提取收/

  • 附录 - AI

    基本概念、云服务简介、专有名词解释: 文字识别服务 OCR:文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 对象存储服务 OBS:对象存储服务(Object

  • 方案概述 - AI

    创建用于存储发票识别与验真结果的对象存储服务 OBS桶,企业业务系统定时从该桶中获取结果并处理。 函数工作流 FunctionGraph:用于实现调用文字识别服务的业务逻辑,当OBS桶收到上传的发票文件后,会自动通知函数调用文字识别服务,并将结果存放到指定的OBS桶里。 文字识别 OCR

  • VIN码识别 - 文字识别 OCR

    VIN码识别 功能介绍 识别图片中的车架号信息,并将识别结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 VIN码示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到4096px之间。

  • 定额发票识别 - 文字识别 OCR

    定额发票识别 功能介绍 识别定额发票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 定额发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。

  • 火车票识别 - 文字识别 OCR

    火车票识别 功能介绍 识别火车票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 火车票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。

  • 营业执照识别 - 文字识别 OCR

    营业执照识别 功能介绍 识别营业执照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 营业执照示例图 图2 营业执照示例图-横版 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片及PDF。

  • 附录 - AI

    靠的方式运行。此外,按函数实际执行资源计费,不执行不产生费用。 文字识别 OCR:提供在线文字识别服务,将图片或扫描件中的文字识别成可编辑的文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。

  • 获取识别结果 - 文字识别 OCR

    获取识别结果 解读识别结果 识别结果后处理

  • 承兑汇票识别 - 文字识别 OCR

    图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像。 不支持角度旋转的图片识别。 支持电子承兑汇票,对于拍照场景、复杂背景支持欠佳。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 调用方法 请参见如何调用API。 前提条件 在使用

  • 户口本识别 - 文字识别 OCR

    户口本识别 功能介绍 识别户口本中的文字信息,并返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

  • 银行回单识别 - 文字识别 OCR

    图像各边的像素大小在15px到8192px之间。 支持同时返回单张图像中存在的多张回单识别结果。 图像中key值对应的value值为空时,不会返回对应的键值对。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。