已找到以下 156 条记录
产品选择
文字识别 OCR
没有找到结果,请重新输入
产品选择
文字识别 OCR
产品选择
没有找到结果,请重新输入
  • 不动产证识别 - 文字识别 OCR

    不动产证识别 功能介绍 识别不动产证中的文字信息,并返回识别的结构化结果。 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 支持图像中不动产证任意角度的水平旋转。

  • 自定义模板OCR - 文字识别 OCR

    自定义模板OCR OCR自定义模板将于2025.12.31正式下线,为避免影响您目前的业务,请您及时进行相关迁移工作,迁移指导详见OCR自定义模板下线公告。 功能介绍 自定义模板OCR,支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面操作,指定需要识别的关键字段,

  • 开始使用 - 文字识别 OCR

    开始使用 通过华为云控制台使用 登录华为云对象存储服务控制台,查看部署完成后,自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件。 图2 上传待识别发票

  • 发票验真 - 文字识别 OCR

    发票验真 功能介绍 支持10种增值税发票的信息核验: 增值税专用发票、增值税普通发票、增值税普通发票(卷式)、增值税电子专用发票、增值税电子普通发票、增值税电子普通发票(通行费)、二手车销售统一发票、机动车销售统一发票、区块链电子发票、全电发票,支持返回票面的全部信息。 该接口的

  • 车辆合格证识别 - 文字识别 OCR

    车辆合格证识别 功能介绍 识别车辆合格证中的文字信息,并返回识别的结构化结果。 约束与限制 只支持中国大陆车辆合格证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 图像中识别区域有效占比超过80%,保证整张车辆合格证内容及其边缘包含在图像内。

  • 泰国车牌识别 - 文字识别 OCR

    泰国车牌识别 功能介绍 识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 泰国车牌示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。

  • 防疫健康码识别 - 文字识别 OCR

    防疫健康码识别 功能介绍 支持对全国各地区不同版式的防疫健康码中的姓名、健康码更新时间、健康码颜色,并将识别的结构化结果返回给用户。 支持识别4种健康码颜色,包括绿码、黄码、红码、灰码;支持返回各个关键字段的置信度,以便提高人工校验效率。 已推出三码合一功能(健康码、核酸检测记录

  • 电子面单识别 - 文字识别 OCR

    电子面单识别 功能介绍 识别用户上传的电子面单图片中的文字内容,并将识别的结果以JSON格式返回给用户。 图1 电子面单示例图 约束与限制 电子面单支持的版式以样例为准。 支持识别JPG、PNG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 调用方法

  • 核酸检测记录识别 - 文字识别 OCR

    核酸检测记录识别 功能介绍 支持对全国各地不同版式的核酸检测记录中的4个关键字段进行结构化识别,包括姓名、核酸检测采样时间、检测检测结果更新时间、核酸检测结果(阳性、阴性、未知) 图1 核酸检测记录版式示例 防疫健康码识别已推出三码合一功能(健康码、核酸检测记录、行程卡)。相比于

  • 泰文身份证识别 - 文字识别 OCR

    泰文身份证识别 功能介绍 识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制

  • 调用SDK实现通用表格识别 - 文字识别 OCR

    调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK

  • 本地调用 - 文字识别 OCR

    本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。

  • 返回结果 - 文字识别 OCR

    返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组数字代码,状态码表示了请求响应的状态,如果调用后返回状态码为2xx,则表示调用成功。完整的状态码列表请参见状态码。 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type”。例如表1所示。

  • 支持云审计的关键操作 - 文字识别 OCR

    支持云审计的关键操作 操作场景 平台提供了云审计服务。通过云审计服务,您可以记录与OCR相关的操作事件,便于日后的查询、审计和回溯。 前提条件 已开通云审计服务。 支持审计的关键操作列表 表1 云审计服务支持的OCR操作列表 操作名称 资源类型 事件名称 开通服务 ai_service

  • SSL配置报错 - 文字识别 OCR

    SSL配置报错 Java SDK SSL配置属可选项,用户可根据具体需求确认是否需要SSL证书验证,详情如下: // 根据需要配置是否跳过SSL证书验证 // 执行SDK时出现javax.net.ssl.SSLHandshakeException: Received fatal

  • 为IAM用户分配权限 - 文字识别 OCR

    为IAM用户分配权限 IAM用户自行开通OCR服务 使用主账号登录IAM服务控制台 打开用户组列表,找到子用户所在的用户组,单击该用户组的“授权”操作。 勾选需要授予用户组的权限,单击“确定”,完成用户组授权。OCR全部系统权限请参见权限管理。 当现有策略不满足时,可使用OCR自定义策略