检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OCR服务是否支持离线使用 不支持离线使用,调用SDK必须能够访问公网才可以的,因为OCR接口部署在华为云云端,所以需要您的网络可以访问公网才可以调用服务接口。 父主题: 产品咨询类
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
如何关闭已申请的服务 主账号可在“开通管理”里控制子用户服务的开通、关闭。 服务开通后,如不再使用,可登录主账号在控制台单击“开通管理”进行关闭。 图1 服务关闭 父主题: 服务开通类
如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变
如何查看API的使用量 登录文字识别管理控制台。 在左侧导航栏中选择“服务监控”,查看API的使用量。 图1 服务监控 父主题: API使用类
开通按钮置灰,如何处理 问题现象 登录OCR控制台后,发现“开通服务”按钮置灰,无法开通服务。 原因分析 可能是因为当前使用的是IAM用户,IAM用户没有开通服务的权限。账号与IAM用户可以类比为父子关系,账号是资源归属以及计费的主体,对其拥有的资源具有所有权限。 解决措施 使用账号登录OCR控制台,开通服务。
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64
如何选择OCR套餐包的区域 不同的地域之间资源包不互通,每个地域需分别购买,请根据您的实际需求慎重选择。各服务所部署区域请参见终端节点。 请先确定使用的服务与区域之后再购买相应区域的套餐包。 父主题: 服务开通类
如何修改返回结果的response类型 使用使用python调用OCR API获取response中的具体内容时,如果需要对返回结果的response类型进行修改。可以使用 to_dict()、to_str() 进行格式转换,to_dict()是转换为json格式,to_str()
忘记AK和SK,该如何查找 每个访问密钥仅能下载一次,为了账号安全性,建议您定期更换并妥善保存访问密钥。 如果您的访问密钥AK/SK已丢失,建议您先创建新的访问密钥AK/SK,并使用新的访问密钥AK/SK替换正在使用的应用程序等的访问密钥AK/SK之后,确认无其他业务影响,再将丢
如何解决账号锁定“The account is locked.” 华为云账号锁定后,请等待15分钟,重新进行登录。如果需要修改密码,请参见重置密码(可选)。 重置密码(可选) 主动修改密码 如果您的华为云账号暂未升级成华为账号,且您记得当前密码,需要主动修改密码,可以在“基本信息”中修改自己的密码。
企业主账号购买的套餐包资源,子账号如何使用 “企业主账号”与“子账号”为通俗意义的说法,准确上为“账号”与“IAM用户”。账号与IAM用户可以类比为父子关系,账号是资源归属以及计费的主体,对其拥有的资源具有所有权限。IAM用户由账号创建,只能拥有账号授予的资源使用权限,账号可以随
识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中
配置客户端连接参数 默认配置 // 使用默认配置 HttpConfig httpConfig = HttpConfig(); 网络代理(可选) // 根据需要配置网络代理 httpConfig.setProxyProtocol("http"); httpConfig.setProxyHost("proxy
单元格行信息,列表形式。多个连续值表示单元格垮多行。 columns Array of integers 单元格列信息,列表形式。多个连续值表示单元格垮多列。 cell_location Array<Array<Integer>> 单元格位置信息,列表形式,分别表示单元格4个顶点的x
在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认
文字识别的终端节点如表1所示,请您根据业务需要选择对应区域的终端节点。 业务的服务器部署区域与OCR服务区域不一致,只要服务器可以访问公网,即可使用OCR服务。一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。 表1 文字识别的终端节点 区域名称
通用类 功能介绍 通用表格识别 提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。 通用文字识别 提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。 手写文字识别 识别
保险单识别 财务报表识别 道路运输从业资格证识别 通用表格识别 支持对图片中的所有表格文字信息进行识别和提取,可识别常规表格及合并单元格表格中的中英文和部分繁体字。能够返回文本块坐标及单元格坐标信息,方便用户进行版式的二次处理以及提高人工校验效率。 该接口可应用于信息登记表识别场景,对
了解更多常见问题、案例和解决方案 热门案例 如何使用OCR服务? 如何使用SDK调用华为云OCR服务? 如何使用Postman调用华为云OCR服务? 如何处理ModelArts.4204服务未开通报错? OCR服务识别结果可以转化为Word或者TXT吗? OCR服务提供哪些版本的SDK? 如何查看API使用次数?