已找到以下 140 条记录
AI智能搜索
产品选择
文字识别 OCR
没有找到结果,请重新输入
产品选择
文字识别 OCR
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 如何提高识别速度 - 文字识别 OCR

    如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。

  • 如何提高识别精度 - 文字识别 OCR

    如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平

  • 计费FAQ - 文字识别 OCR

    账号余额为0时,为什么还可以继续调用服务从而导致欠费 已关闭OCR服务,为什么会出现额外的计费或欠费 套餐包购买后是否支持退款 套餐用完如何计费,如何查看剩余量及预警 企业主账号购买的套餐包资源,子账号如何使用 多个套餐包扣减顺序 什么是宽限期和保留期 OCR识别中,哪些算有效计费 不同API的套餐包是否可以共享

  • 审计 - 文字识别 OCR

    审计 支持云审计的关键操作 如何查看审计日志

  • 权限类 - 文字识别 OCR

    权限类 使用OCR服务需要的权限 如何通过主账号创建IAM账号 无权在控制台服务监控查看数据

  • 如何选取参照字段? - 文字识别 OCR

    如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变

  • 如何选购合适的API - 文字识别 OCR

    如何选购合适的API 文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。 除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别:提取图片内的文字及其对应位置信息。

  • 如何关闭已申请的服务 - 文字识别 OCR

    如何关闭已申请的服务 主账号可在“开通管理”里控制子用户服务的开通、关闭。 服务开通后,如不再使用,可登录主账号在控制台单击“开通管理”进行关闭。 图1 服务关闭 父主题: 服务开通类

  • 开通按钮置灰,如何处理 - 文字识别 OCR

    开通按钮置灰,如何处理 问题现象 登录OCR控制台后,发现“开通服务”按钮置灰,无法开通服务。 原因分析 可能是因为当前使用的是IAM用户,IAM用户没有开通服务的权限。账号与IAM用户可以类比为父子关系,账号是资源归属以及计费的主体,对其拥有的资源具有所有权限。 解决措施 使用账号登录OCR控制台,开通服务。

  • 网络图片识别 - 文字识别 OCR

    图像中有效文字图片占比超过60%,避免有效文字图片占比过小。 支持图像中有效文字图片的任意角度的水平旋转(需开启方向检测)。 调用方法 请参见如何调用API。 前提条件 在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务和认证鉴权章节。 用户首次使用需要先申请开通。

  • 接口返回时间较长,如何提高响应速度 - 文字识别 OCR

    接口返回时间较长,如何提高响应速度 请检查图片的尺寸。若尺寸过大会导致图片在网络传输过程中耗时较长,建议在不改变图片质量的情况下对图片进行等比例缩放。 检查网络带宽是否稳定,是否存在网络波动,建议提升网络带宽避免网络时延较长。 父主题: 产品咨询类

  • 如何修改返回结果的response类型 - 文字识别 OCR

    如何修改返回结果的response类型 使用使用python调用OCR API获取response中的具体内容时,如果需要对返回结果的response类型进行修改。可以使用 to_dict()、to_str() 进行格式转换,to_dict()是转换为json格式,to_str()

  • 如何获取图片base64编码 - 文字识别 OCR

    如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64

  • 如何解决账号锁定“The account is locked.” - 文字识别 OCR

    如何解决账号锁定“The account is locked.” 华为云账号锁定后,请等待15分钟,重新进行登录。如果需要修改密码,请参见重置密码(可选)。 重置密码(可选) 主动修改密码 如果您的华为云账号暂未升级成华为账号,且您记得当前密码,需要主动修改密码,可以在“基本信息”中修改自己的密码。

  • 如何选择OCR套餐包的区域 - 文字识别 OCR

    如何选择OCR套餐包的区域 不同的地域之间资源包不互通,每个地域需分别购买,请根据您的实际需求慎重选择。各服务所部署区域请参见终端节点。 请先确定使用的服务与区域之后再购买相应区域的套餐包。 父主题: 服务开通类

  • 查看应用详情 - 文字识别 OCR

    作列的“查看”。进入应用详情页,默认进入“应用资产”页面,查看应用资产。 您也可以单击“应用开发”,切换至“应用开发”页面,查看应用开发配置。 图1 进入应用资产 查看应用资产 在“应用资产”页面下,可以查看当前应用的资产信息。 使用预置工作流开发应用,“应用资产”可查看“模板列表”和“自定义字段类型”。

  • 识别字符出现错误如何优化? - 文字识别 OCR

    识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中

  • 什么是文字识别 - 文字识别 OCR

    Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Ja

  • 查看监控指标 - 文字识别 OCR

    查看监控指标 操作步骤如下: 登录管理控制台。 在左侧导航栏选择“服务监控”。 图1 服务监控 父主题: 监控

  • 概述 - 文字识别 OCR

    Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用AP