检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类
使用Postman调用时,出现标头溢出的情况 通过API调用Postman获取Token进行认证鉴权时,如果出现“Error:Header overflow”的标头溢出问题,可参考如下解决方案。 修改操作系统的环境变量。windows10系统中,需要鼠标右键单击“此电脑”,选择属性,在“高级
version} python setup.py install 开始使用 在开始使用之前,请确保您安装的是最新版本的SDK。使用过时的版本可能会导致兼容性问题或无法使用最新功能。您可以通过运行以下命令来检查并更新SDK至最新版本。 pip show huaweicloudsdkcore
使用OCR服务需要的权限 使用OCR服务时,如果您需要使用华为云对象存储服务(OBS)中的数据,请开通对象存储服务OBS授权,可在控制台进行开通。 OCR服务支持IAM细粒度划分策略。可以为子用户设置OCR服务的使用权限。 父主题: 权限类
OCR服务的SDK需要付费购买吗 OCR服务SDK供用户免费下载,并依据API调用次数进行收费。 父主题: SDK使用类
如何查看API的使用量 登录文字识别管理控制台。 在左侧导航栏中选择“服务监控”,查看API的使用量。 图1 服务监控 父主题: API使用类
通用文字识别 功能介绍 识别图片上的文字信息,以JSON格式返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 支持中英文以及部分繁体字。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 通用文字示例图 约束与限制
运行时请确保文件路径 d:/demo.jpg 是正确的,并且文件确实存在于此路径下。部分 Windows 环境下字符编码的默认设置可能与代码不兼容,导致读取后的解码报错。这种情况下可以尝试将代码中的decode()修改为decode('utf-8')来匹配适合的字符编码。 图1
本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。 前提条件 注册华为账号并开通华为
@huaweicloud/huaweicloud-sdk-ocr 开始使用 在开始使用之前,请确保您安装的是最新版本的SDK。使用过时的版本可能会导致兼容性问题或无法使用最新功能。您可以通过运行以下命令来检查并更新SDK至最新版本。 npm list @huaweicloud/huaweicloud-sdk-core
OCR服务提供哪些版本的SDK 目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具体请参考文字识别服务《SDK参考》手册,该手册详细介绍了SDK支持的版本及使用方法。 如果想用其他编程语言调用OCR API服务,可以使用Token鉴权方
调用OCR服务的区域可以与OBS资源的区域不一致吗 不支持跨区域OBS,OBS的区域需要和调用服务区域保持一致。 对于开启公共读授权的OBS资源公网可访问,可支持跨区域调用,虽然使用比较方便,但若对于敏感的信息,例如个人的私有数据,存在泄露风险。建议您调用的文字识别服务和OBS服务是在同一个区域。
xml。SDK常见报错请参考代码运行报错、json解析报错。 开始使用 在开始使用之前,请确保您安装的是最新版本的SDK。使用过时的版本可能会导致兼容性问题或无法使用最新功能。您可以通过运行以下命令来检查SDK版本,并在SDK中心获取最新的SDK包版本。 mvn dependency:tree
忘记AK和SK,该如何查找 每个访问密钥仅能下载一次,为了账号安全性,建议您定期更换并妥善保存访问密钥。 如果您的访问密钥AK/SK已丢失,建议您先创建新的访问密钥AK/SK,并使用新的访问密钥AK/SK替换正在使用的应用程序等的访问密钥AK/SK之后,确认无其他业务影响,再将丢失的访问密钥AK/SK停
后端检查上一个请求结果,上一个请求返回之后再发送下一个请求,避免请求过于频繁。 如果需要更大的并发需求,尤其是常态性的持续多并发需求,请通过华为云客服联系我们。详细描述您的使用场景和并发需求。 父主题: API使用类
企业主账号购买的套餐包资源,子账号如何使用 “企业主账号”与“子账号”为通俗意义的说法,准确上为“账号”与“IAM用户”。账号与IAM用户可以类比为父子关系,账号是资源归属以及计费的主体,对其拥有的资源具有所有权限。IAM用户由账号创建,只能拥有账号授予的资源使用权限,账号可以随
如何修改返回结果的response类型 使用使用python调用OCR API获取response中的具体内容时,如果需要对返回结果的response类型进行修改。可以使用 to_dict()、to_str() 进行格式转换,to_dict()是转换为json格式,to_str()
文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK 步骤3:获取示例代码
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数
请检查OBS文件。 ModelArts.4705 The file stored on the OBS is oversized. OBS文件大小超限。 请检查OBS文件大小,请使用符合服务大小限制的文件作为输入。 ModelArts.4706 The Obs file is not