检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何选购合适的API 文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。 除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别:提取图片内的文字及其对应位置信息。
如何关闭已申请的服务 主账号可在“开通管理”里控制子用户服务的开通、关闭。 服务开通后,如不再使用,可登录主账号在控制台单击“开通管理”进行关闭。 图1 服务关闭 父主题: 服务开通类
如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变
解读识别结果 本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。 以下图识别结果为例,讲解图片内容如何与API的返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含
已关闭OCR服务,为什么会出现额外的计费或欠费 套餐包购买后是否支持退款 套餐用完如何计费,如何查看剩余量及预警 企业主账号购买的套餐包资源,子账号如何使用 多个套餐包扣减顺序 什么是宽限期和保留期 OCR识别中,哪些算有效计费 不同API的套餐包是否可以共享 OCR文字识别服务计费可以按照项目来分别计费吗
通用文字识别 功能介绍 识别图片上的文字信息,以JSON格式返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 支持中英文以及部分繁体字。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 通用文字示例图 约束与限制
开通按钮置灰,如何处理 问题现象 登录OCR控制台后,发现“开通服务”按钮置灰,无法开通服务。 原因分析 可能是因为当前使用的是IAM用户,IAM用户没有开通服务的权限。账号与IAM用户可以类比为父子关系,账号是资源归属以及计费的主体,对其拥有的资源具有所有权限。 解决措施 使用账号登录OCR控制台,开通服务。
如何修改返回结果的response类型 使用使用python调用OCR API获取response中的具体内容时,如果需要对返回结果的response类型进行修改。可以使用 to_dict()、to_str() 进行格式转换,to_dict()是转换为json格式,to_str()
如何选择OCR套餐包的区域 不同的地域之间资源包不互通,每个地域需分别购买,请根据您的实际需求慎重选择。各服务所部署区域请参见终端节点。 请先确定使用的服务与区域之后再购买相应区域的套餐包。 父主题: 服务开通类
接口返回时间较长,如何提高响应速度 请检查图片的尺寸。若尺寸过大会导致图片在网络传输过程中耗时较长,建议在不改变图片质量的情况下对图片进行等比例缩放。 检查网络带宽是否稳定,是否存在网络波动,建议提升网络带宽避免网络时延较长。 父主题: 产品咨询类
如何解决账号锁定“The account is locked.” 华为云账号锁定后,请等待15分钟,重新进行登录。如果需要修改密码,请参见重置密码(可选)。 重置密码(可选) 主动修改密码 如果您的华为云账号暂未升级成华为账号,且您记得当前密码,需要主动修改密码,可以在“基本信息”中修改自己的密码。
识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中
OBS failed. 获取OBS文件失败。 请检查OBS文件。 ModelArts.4705 The file stored on the OBS is oversized. OBS文件大小超限。 请检查OBS文件大小,请使用符合服务大小限制的文件作为输入。 ModelArts.4706
了解更多常见问题、案例和解决方案 热门案例 如何使用OCR服务? 如何使用SDK调用华为云OCR服务? 如何使用Postman调用华为云OCR服务? 如何处理ModelArts.4204服务未开通报错? OCR服务识别结果可以转化为Word或者TXT吗? OCR服务提供哪些版本的SDK? 如何查看API使用次数?
我们用区域和可用区来描述数据中心的位置,您可以在特定的区域、可用区创建资源。 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region
文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK 步骤3:获取示例代码 步骤4:调用服务
企业项目财务管理 开通了企业项目的客户,可以按企业项目查看各个企业项目的月度消费汇总、消费明细、产品费用走势和费用分布。 进入项目管理的“企业项目管理”页面,单击企业项目操作列的“查看消费 ”,查看各企业项目的费用信息。 图1 查看费用信息 父主题: 企业项目管理
API使用类 如何查看API的使用量 为什么实际调用次数与界面记录次数不一致 API是否可以混用 OCR服务支持批量识别吗 OCR服务识别结果可以转化为Word、TXT、pdf吗 如何获取图片base64编码 OCR的并发是多少 调用OCR服务的区域可以与OBS资源的区域不一致吗
增值税发票管理系统开具的发票。 税务局数据同步有时延,建议当天新开的发票在24小时后查询。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 调用方法 请参见如何调用API。 前提条件 在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务和认证鉴权章节。
with_endpoint(endpoint) \ .build() endpoint是华为云各服务应用区域和各服务的终端节点,详情请查看 地区和终端节点 。 发送请求并查看响应 # 以调用通用表格识别接口 RecognizeGeneralTable 为例 request = Recogniz