已找到以下 197 条记录。
产品选择
文字识别 OCR
没有找到结果,请重新输入
产品选择
文字识别 OCR
产品选择
没有找到结果,请重新输入
  • 证件类 - 文字识别 OCR

    证件类 功能介绍 身份证识别 自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息。 户口本识别 自动识别居民户口本户主页及成员页,并返回部分关键字段信息。 驾驶证识别 自动识别驾驶证正页与副页上的全部信息,自动提取出姓名、性别、领证

  • OCR服务可以识别文本格式文件吗 - 文字识别 OCR

    OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类

  • 统计API使用量 - 文字识别 OCR

    统计API使用量 文字识别控制台 > 服务监控支持查看API的总调用量、调用成功量、调用失败量。 如果您购买了套餐包,可在“套餐包管理”页面,查看已有的套餐包及使用详情。套餐包费用扣减规则请参见“产品介绍 > 计费说明”。 图1 服务监控

  • 定义预处理 - 文字识别 OCR

    “预处理”逻辑快速处理图片,也可以按左上角操作指标调整图片。 图1 定义预处理 右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向水平。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图

  • 文字识别SDK简介 - 文字识别 OCR

    文字识别(Optical Character Recognition,简称OCR)将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入,提升业务效率。支持身份证、驾驶证、行驶证、发票、通用表格、通用文字等场景文字识别。 文字识别以开放API(Application Programming I

  • 定义预处理 - 文字识别 OCR

    择模板”下拉框中选择模板,对每个模板图片进行预处理。 图1 多模板定义预处理 在右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。 单击预处理区域左上方的操作图标,调整模板图片的大小、方向等。 :单击图

  • 如何通过主账号创建IAM账号 - 文字识别 OCR

    如何通过主账号创建IAM账号 OCR服务支持IAM细粒度划分策略,主账号可以为子用户设置OCR服务的使用权限。 如果您需要将资源分配给企业中不同的员工或者应用程序使用,您可以使用IAM的用户管理功能,给员工或应用程序创建IAM用户。 父主题: 权限类

  • 计费模式概述 - 文字识别 OCR

    效期内使用完。 按照API调用次数收费,按次进行结算。 变更计费模式 支持变更为按需计费模式。 套餐包到期后或套餐包使用完后,如果没有及时续费或购买新的套餐包,系统将自动转为按需计费方式。 套餐包转按需 支持变更为套餐包计费模式。 按需转套餐包 适用场景 适用于可预估资源使用周期

  • ModelArts.4603、ModelArts.4704报错处理方法 - 文字识别 OCR

    the file from the URL failed. "表示从URL获取图片数据失败,可通过以下几个方面进行排查:(1)请确保提供的URL支持HTTP/HTTPS请求协议,即格式为http/https url;(2)请检查存储图片的服务器是否稳定可靠,网络连接是否有异常,是否公网

  • 调用说明 - 文字识别 OCR

    调用说明 文字识别提供了REST(Representational State Transfer)风格的API,支持您通过HTTPS请求调用,调用方法请参见如何调用API。 调用API时,需要用户网络可以访问公网。 同时文字识别还提供多种编程语言的SDK供您使用,SDK的使用方法请参见《SDK参考》。

  • 框选参照字段 - 文字识别 OCR

    框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。

  • 为IAM用户分配权限 - 文字识别 OCR

    使用主账号登录IAM服务控制台 打开用户组列表,找到子用户所在的用户组,单击该用户组的“授权”操作。 勾选需要授予用户组的权限,单击“确定”,完成用户组授权。OCR全部系统权限请参见权限管理。 当现有策略不满足时,可使用OCR自定义策略 IAM用户被赋予相应权限后,可使用IAM用户登录OCR控制台,开通所需的服务。

  • 框选参照字段 - 文字识别 OCR

    框选参照字段 在识别文字的过程中,套件会先对图片进行模板分类,再检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了正确分类并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于哪一

  • OCR服务提供哪些版本的SDK - 文字识别 OCR

    目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具体请参考文字识别服务《SDK参考》手册,该手册详细介绍了SDK支持的版本及使用方法。 如果想用其他编程语言调用OCR API服务,可以使用Token鉴权方式,实现接口调用。具体请参考文字识别服务接口《AP

  • 智能文档解析 - 文字识别 OCR

    优势 简单智能 无需训练直接调用,自动输出结构化信息,简单高效。 多版式 不受版式数量影响,支持多版式卡证、票据,适用场景广泛。 多功能 键值对提取、表格识别与版面分析多功能支持,大幅降低了文档分析难度,识别精度95% 降本增效 降低版式定制成本,提升信息录入、票证信息审批等业务场景的效率。

  • 购买套餐包后,为什么会出现额外的计费或欠费 - 文字识别 OCR

    无法对当前产生费用进行扣费,就会导致欠费。 套餐包额度未使用完 请登录费用中心检查套餐包的购买区域,与调用API的区域是否一致,套餐包不支持跨区调用。同时检查开通套餐包的API与实际调用的API是否一致。 父主题: 计费FAQ

  • 如何提高识别精度 - 文字识别 OCR

    尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平 5:1 内(具体请以各个服务API文档为准)。

  • 智能分类 - 文字识别 OCR

    场景二:相同类型发票识别 场景三:不同类型发票识别 识别类型 卡证类 目前支持的卡证类包含:身份证(包含头像面、国徽面)、驾驶证(包含主页、副页)、行驶证(包含主页、副页)、护照、银行卡、道路运输证等。 票据类 目前支持的票据类包含:增值税发票(包含专用发票、普通发票、电子普通发票)、机

  • 按需、套餐包扣减顺序 - 文字识别 OCR

    按需、套餐包扣减顺序 同一个区域下的同一个API,用户开通了按需,又购买了套餐包的情况下,优先抵扣套餐包的。 多个套餐包扣减顺序 套餐包费用为一次性支付,支持指定日期生效或立即生效。 套餐包可叠加使用,如果您购买了多个套餐包,则套餐包的扣减规则如下: 按照套餐包来源类型扣费,扣减优先级由高到低为:免费额度->套餐包计费->按需计费。

  • 状态码 - 文字识别 OCR

    Not Found 所请求的资源不存在。 建议直接修改该请求,不要重试该请求。 405 Method Not Allowed 请求中带有该资源不支持的方法。 建议直接修改该请求,不要重试该请求。 406 Not Acceptable 服务器无法根据客户端请求的内容特性完成请求。 407