已找到以下 211 条记录
产品选择
文字识别 OCR
没有找到结果,请重新输入
产品选择
文字识别 OCR
产品选择
没有找到结果,请重新输入
  • 如何调用API - 文字识别 OCR

    如何调用API 总览 开通服务 构造请求 认证鉴权 返回结果

  • 忘记AK和SK,该如何查找 - 文字识别 OCR

    忘记AK和SK,该如何查找 每个访问密钥仅能下载一次,为了账号安全性,建议您定期更换并妥善保存访问密钥。 如果您访问密钥AK/SK已丢失,建议您先创建新访问密钥AK/SK,并使用新访问密钥AK/SK替换正在使用应用程序等访问密钥AK/SK之后,确认无其他业务影响,再将丢失访问密钥

  • OCR服务SDK是否依赖于Maven管理依赖包 - 文字识别 OCR

    OCR服务SDK是否依赖于Maven管理依赖包 Python SDK依赖部分包如requests等需要在本地环境中安装,在连通外网情况下可直接使用pip install +包名安装。 Java SDK不需要使用Maven管理本地依赖包,可以直接运行使用。 父主题: SDK使用类

  • 如何提高识别速度 - 文字识别 OCR

    如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程时间,因此建议在图片文字清晰情况下,适当压缩图片大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类小图(文字少)在1M以下,A4纸大小密集文档大图在2M以下。

  • 如何解决账号锁定“The account is locked.” - 文字识别 OCR

    ”中修改自己密码。 如果您华为云账号已升级成华为账号,且您记得当前密码,需要主动修改密码,可以在“基本信息”中单击“华为账号信息”右侧“前往管理”,前往华为账号网站>账号与安全>安全中心,重置账号密码。 如果您是IAM用户,且您记得当前密码,可以在控制台页面,鼠标移动至右上

  • 票据类 - 文字识别 OCR

    段,快速将增值税发票上文字信息识别出来,用于后续进一步处理,节省大量的人工录入成本。 机动车销售发票识别 自动识别机动车销售发票图片内文本内容,并返回结构化字段信息,用于后续进一步处理,节省大量的人工录入成本。 飞机行程单识别 自动识别飞机行程单全部信息,一次扫描即可识

  • 使用OCR服务需要权限 - 文字识别 OCR

    使用OCR服务需要权限 使用OCR服务时,如果您需要使用华为云对象存储服务(OBS)中数据,请开通对象存储服务OBS授权,可在控制台进行开通。 OCR服务支持IAM细粒度划分策略。可以为子用户设置OCR服务使用权限。 父主题: 权限类

  • 如何提高识别精度 - 文字识别 OCR

    如何提高识别精度 尽量使用文字清晰度高、无反光图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平

  • 返回结果 - 文字识别 OCR

    状态码是一组数字代码,状态码表示了请求响应状态,如果调用后返回状态码为2xx,则表示调用成功。完整状态码列表请参见状态码。 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type”。例如表1所示。 表1 响应消息头 名称 说明 Content-Length 响应消息体字节长度,单位为Byte。

  • 认证鉴权 - 文字识别 OCR

    Token在计算机系统中代表令牌(临时)意思,拥有Token就代表拥有某种权限。Token认证就是在调用API时候将Token加到请求消息头,从而通过身份认证,获得操作API权限。 Token有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。 如果您华为云账号已升级

  • 如何获取图片base64编码 - 文字识别 OCR

    如何获取图片base64编码 OCR服务输入图片参数是图片base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线图片转base64工具。 使用时,需要将代码d:\demo.jpg替换为实际图片路径。 import base64

  • 解读识别结果 - 文字识别 OCR

    本章节通过网络图片识别API介绍如何解读调API返回JSON格式识别结果。请参照API参考“响应参数”章节比对查看。 以下图识别结果为例,讲解图片内容如何与API返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含了图片中文字块数目、文字块

  • 调用SDK实现通用表格识别 - 文字识别 OCR

    文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供REST API进行封装,以简化用户开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK 步骤3:获取示例代码

  • 文字识别 - 文字识别 OCR

    了解更多常见问题、案例和解决方案 热门案例 如何使用OCR服务? 如何使用SDK调用华为云OCR服务? 如何使用Postman调用华为云OCR服务? 如何处理ModelArts.4204服务未开通报错? OCR服务识别结果可以转化为Word或者TXT吗? OCR服务提供哪些版本SDK? 如何查看API使用次数?

  • 如何选取参照字段? - 文字识别 OCR

    如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段内容和位置将作为相应模板分类特征。 在框选参照字段时,首先要确保所框选文字位置和内容都固定不变

  • 发票验真 - 文字识别 OCR

    携带正确的ID,正常使用OCR服务,账单企业项目会被分类到企业ID对应企业项目中。 携带格式正确但不存在ID,正常使用OCR服务,账单企业项目会显示对应不存在企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单企业项目会被分类到"default"中。 表3 请求Body参数

  • OCR服务提供哪些版本SDK - 文字识别 OCR

    OCR服务提供哪些版本SDK 目前OCR提供SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具体请参考文字识别服务《SDK参考》手册,该手册详细介绍了SDK支持版本及使用方法。 如果想用其他编程语言调用OCR API服务,可以使用Toke

  • 与其他云服务关系 - 文字识别 OCR

    Service,简称OBS)是稳定、安全、高效、易用云存储服务。文字识别接口都涉及到对用户数据处理,用户大量数据采用OBS批量方式处理,可以提升云上处理总体效率。 文字识别接口支持从OBS上采用临时授权或者匿名公开授权方式获取数据并进行处理。

  • 接口返回时间较长,如何提高响应速度 - 文字识别 OCR

    接口返回时间较长,如何提高响应速度 请检查图片尺寸。若尺寸过大会导致图片在网络传输过程中耗时较长,建议在不改变图片质量情况下对图片进行等比例缩放。 检查网络带宽是否稳定,是否存在网络波动,建议提升网络带宽避免网络时延较长。 父主题: 产品咨询类

  • 服务韧性 - 文字识别 OCR

    服务韧性 OCR提供三级可靠性架构,通过AZ之间容灾、AZ内实例冗余、实例健康检测等技术方案,保障服务可靠性。 父主题: 安全