检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何调用API 总览 开通服务 构造请求 认证鉴权 返回结果
硬编码到代码中或者明文存储都有很大的安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 本示例以 ak 和 sk 保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。 认证参数说明:
构造请求 本节介绍REST API请求的组成,并以调用网络图片识别接口说明如何调用API。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987 。 请求URI 请求URI由如下部分组成。 {URI-scheme}
根据实际情况选填,参数部分可参考APIE界面的“接口文档”。 单击调试,在“调试结果”中查看调用结果。 图1 APIE在线调试 父主题: 如何调用API
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
成本管理 随着上云企业越来越多,企业对用云成本问题也越发重视。使用文字识别服务OCR时,如何进行成本管理,减轻业务负担呢?本文将从成本构成、成本分配、成本分析和成本优化四个维度介绍成本管理,帮助您通过成本管理节约成本,在保障业务快速发展的同时获得最大成本收益。 成本构成 使用文字
通用单模板工作流 根据工作流指引,创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。 通用单模板工作流 多模板分类工作流 根据工作流指引,创建多模板服务,通过多模板训练模板分类器和文字识别模型,实现多模板图像的文字信息结构化提取。 多模板分类工作流 调用API 调
如何查看API的使用量 登录文字识别管理控制台。 在左侧导航栏中选择“服务监控”,查看API的使用量。 图1 服务监控 父主题: API使用类
开通按钮置灰,如何处理 问题现象 登录OCR控制台后,发现“开通服务”按钮置灰,无法开通服务。 原因分析 可能是因为当前使用的是IAM用户,IAM用户没有开通服务的权限。账号与IAM用户可以类比为父子关系,账号是资源归属以及计费的主体,对其拥有的资源具有所有权限。 解决措施 使用账号登录OCR控制台,开通服务。
如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变
如何关闭已申请的服务 主账号可在“开通管理”里控制子用户服务的开通、关闭。 服务开通后,如不再使用,可登录主账号在控制台单击“开通管理”进行关闭。 图1 服务关闭 父主题: 服务开通类
方案概述 应用场景 该解决方案基于华为云文字识别服务增值税发票识别与发票验真技术构建,自动识别和录入增值税发票各字段信息,减少人工核算工作量,实现财税报销自动化。同时,自动接入国家税务机关发票查验平台进行发票真伪核验,降低企业人力查验成本,防止税务合规风险。支持增值税发票、增值税普通
忘记AK和SK,该如何查找 每个访问密钥仅能下载一次,为了账号安全性,建议您定期更换并妥善保存访问密钥。 如果您的访问密钥AK/SK已丢失,建议您先创建新的访问密钥AK/SK,并使用新的访问密钥AK/SK替换正在使用的应用程序等的访问密钥AK/SK之后,确认无其他业务影响,再将丢
接口返回时间较长,如何提高响应速度 请检查图片的尺寸。若尺寸过大会导致图片在网络传输过程中耗时较长,建议在不改变图片质量的情况下对图片进行等比例缩放。 检查网络带宽是否稳定,是否存在网络波动,建议提升网络带宽避免网络时延较长。 父主题: 产品咨询类
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.getenv("CLOUD_SDK_AK") sk = os.getenv("CLOUD_SDK_SK")
如何选择OCR套餐包的区域 不同的地域之间资源包不互通,每个地域需分别购买,请根据您的实际需求慎重选择。各服务所部署区域请参见终端节点。 请先确定使用的服务与区域之后再购买相应区域的套餐包。 父主题: 服务开通类
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64
如何修改返回结果的response类型 使用使用python调用OCR API获取response中的具体内容时,如果需要对返回结果的response类型进行修改。可以使用 to_dict()、to_str() 进行格式转换,to_dict()是转换为json格式,to_str()
识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中