已找到以下 140 条记录
AI智能搜索
产品选择
文字识别 OCR
没有找到结果,请重新输入
产品选择
文字识别 OCR
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 道路运输证识别 - 文字识别 OCR

    使用简介章节。 图1 道路运输证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆道路运输证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px4096px之间。 支持图像中道路运输证任意角度的水平旋转。

  • 调用指南 - 文字识别 OCR

    调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成评估模板步骤,详情请见评估。 操作步骤 在“应用开发>评估”页面完成模板评估后,单击“下一步”

  • 车辆通行费发票识别 - 文字识别 OCR

    参见OCR服务使用简介章节。 图1 车辆通行费发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px4096px之间。 图像中发票区域有效占比超过25%。 支持图像中车辆通行费发票任意角度的水平旋转。

  • 火车票识别 - 文字识别 OCR

    用指导请参见OCR服务使用简介章节。 图1 火车票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px8192px之间。 图像中火车票区域有效占比超过25%。 支持图像中火车票任意角度的水平旋转。

  • 出租车发票识别 - 文字识别 OCR

    请参见OCR服务使用简介章节。 图1 出租车发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px4096px之间。 图像中发票区域有效占比超过25%,保证整张发票内容及其边缘包含在图像内。

  • 营业执照识别 - 文字识别 OCR

    String 该参数与url二选一。 图片的Base64编码,要求Base64编码后大小不超过10MB。 图片最短边不小于15px,最长边不超过8192px,支持JPEG、JPG、PNG、BMP、TIFF、PDF格式。多页PDF仅识别第一页。 图片Base64编码示例如/9j/4AAQSkZJRgABAg

  • 工作流介绍 - 文字识别 OCR

    详细指导 上传模板图片 在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选

  • 机动车销售发票识别 - 文字识别 OCR

    String 该参数与url二选一。 图片的Base64编码,要求Base64编码后大小不超过10MB。 图片最短边不小于100px,最长边不超过8192px。支持JPEG、JPG、PNG、BMP、TIFF、PDF格式。多页PDF仅识别第一页。 图片Base64编码示例如/9j/4AAQSkZJRgABAg

  • 框选识别区 - 文字识别 OCR

    框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“通用单模

  • 框选识别区 - 文字识别 OCR

    框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“多模板分

  • 通用文字识别 - 文字识别 OCR

    接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 detect_direction 否 Boolean 是否校正图片的倾斜角度,可选值如下。

  • 驾驶证识别 - 文字识别 OCR

    image 否 String 该参数与url二选一。 图片的Base64编码,要求Base64编码后大小不超过10MB。 图片最短边不小于100px,最长边不超过8192px。支持JPEG、JPG、PNG、BMP、TIFF格式。 图片Base64编码示例如/9j/4AAQSkZJRgABAg

  • OCR服务使用简介 - 文字识别 OCR

    Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。 OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成

  • 准备数据 - 文字识别 OCR

    API或SDK时,数据主要通过以下两种方法传入。 image 传入图片的base64编码。 您可以通过在线转码工具,浏览器,使用Python中的base64.b64encode函数等方法,获取图片的base64编码。 url 传入图片的url路径。 使用公网http/https url,例如https://support

  • 如何选取参照字段? - 文字识别 OCR

    如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变

  • 防疫健康码识别 - 文字识别 OCR

    与image二选一。 图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 detect_direction 否 Boolean 校正图片的倾斜角度开关,可选值如下所示: true:校正图片的倾斜角度 false:不校正图片的倾斜角度 支持任意角

  • Java SDK - 文字识别 OCR

    </dependency> java.lang.ClassNotFoundException: okhttp3/Interceptor 用户本地引入的Okhttp3 版本和 华为云冲突,okhttp版本要求请见pom.xml。 INFO com.huaweicloud.sdk.core.HcClient

  • 配置OBS访问权限 - 文字识别 OCR

    配置OBS访问权限 EI企业智能服务对于图片、语音等多媒体文件支持直接使用OBS服务的数据处理方式,以减少服务使用成本,降低服务的响应时长,提升服务使用的体验。 考虑数据的安全,当对服务进行授权后,才可以使用授权方式的URL(https://<bucket-name>.<end

  • 通用表格识别 - 文字识别 OCR

    授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 return_text_location

  • 方案概述 - 文字识别 OCR

    部署该解决方案会使用到如下资源: 创建用于上传发票的OBS桶,企业业务系统将员工报销的发票图片或者电子发票PDF文件上传到该桶。 创建用于存储发票识别与验真结果的OBS桶,企业业务系统定时从该桶中获取结果并处理。 函数工作流:用于实现调用文字识别服务的业务逻辑,当OBS桶收到上传的发票文件后,会自动通