检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
API概览 通过使用文字识别服务的自研API,您可以使用文字识别服务的所有功能,如表1所示。 文字识别服务当前支持通用类、证件类、票据类和智能分类四种不同类型的接口。您可以通过在线体验,体验接口的识别效果。 对于固定板式的图片,如果当前接口不满足您的业务需求,可以使用ModelArts
如何查看API的使用量 登录文字识别管理控制台。 在左侧导航栏中选择“服务监控”,查看API的使用量。 图1 服务监控 父主题: API使用类
获取Token时帐密报错 文字识别 OCR ModelArts4204服务未开通报错 02:31 ModelArts4204服务未开通报错 文字识别 OCR 非支持的图片类型报错 01:59 非支持的图片类型报错
开通文字识别服务 OCR服务提供的开通方式有以下两种,用户可以任选其一进行开通服务。 按需计费开通服务 进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,执行开通操作,默认的计费方式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为“已开通”。
估状态为端到端地对待识别图片自动分类并进行结构化识别。 上传在线图片 单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线图片作为测试图片。 上传图片后,右侧会显示模板识别结果,包括“模板ID”、“模板名”、“置信度”。
本示例中需开通通用表格识别API。 如未开通服务,调用服务时会提示ModelArts.4204报错,请在调用服务前先进入控制台开通服务,并注意开通服务区域与调用服务的区域保持一致。 步骤2:安装SDK 获取并安装OCR Python SDK。 以PyCharm为例,介绍如何安装SDK。 在PyCha
”区域。 云服务之间的关系 如果多个云服务一起搭配使用,需要注意: 不同区域的弹性云服务器、关系型数据库、对象存储服务内网不互通。 不同区域的弹性云服务器不支持跨区域部署在同一负载均衡器下。 资源的价格 不同区域的资源价格可能有差异,请参见华为云服务价格详情。 如何选择可用区?
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
$config->setConnectionTimeout(60); SSL配置(可选) // 配置跳过服务端证书验证 $config->setIgnoreSslVerification(true); // 配置服务器端CA证书,用于SDK验证服务端证书合法性 $config->setCertFile("{yourCertFile}");
如下图所示,返回的响应消息头中“x-subject-token”就是需要获取的用户Token。获取Token之后,您就可以使用Token认证调用OCR服务API。 您还可以通过这个视频教程了解如何使用Token认证:https://bbs.huaweicloud.com/videos/101333 。 图1 获取Token示例
使用OCR服务需要的权限 使用OCR服务时,如果您需要使用华为云对象存储服务(OBS)中的数据,请开通对象存储服务OBS授权,可在控制台进行开通。 OCR服务支持IAM细粒度划分策略。可以为子用户设置OCR服务的使用权限。 父主题: 权限类
DK_AK和HUAWEICLOUD_SDK_SK。 初始化客户端(二选一) 指定云服务region方式(推荐) // 初始化指定云服务的客户端 {Service}Client ,以初始化OCR服务的 OcrClient 为例 var client = OcrClient.NewBuilder()
按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。 购买文字识别服务请参考如何选购合适的API。 如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。
服务开通类 如何选购合适的API 如何关闭已申请的服务 开通按钮置灰,如何处理 服务开通之后开通状态显示「未开通」 如何选择OCR套餐包的区域
套餐用完如何计费,如何查看剩余量及预警 套餐包配额使用完后,转为按需计费(按API调用成功的次数计费)。不使用则不计费。具体计费价格请参见文字识别价格详情。 查看套餐余量 登录文字识别控制台。 在“套餐包管理”中查看套餐余量。 图1 套餐包管理 设置套餐包剩余使用量预警 单击文字
OCR服务提供哪些版本的SDK 目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具体请参考文字识别服务《SDK参考》手册,该手册详细介绍了SDK支持的版本及使用方法。 如果想用其他编程语言调用OCR API服务,可以使用Toke
newBuilder() 网络代理(可选) // 使用代理服务器(可选) client.withProxyAgent("http://username:password@proxy.huaweicloud.com:8080") SSL配置(可选) // 配置跳过服务端证书验证(可选) process.env
CallTimeoutException 单次请求,服务器处理超时未返回。 RetryOutageException 在重试策略消耗完成后,仍无有效的响应。 ServiceResponseException 服务器响应异常 ServerResponseException 服务端内部错误,Http响应码:[500
OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类
com/api-ocr/zh-cn_image_0288038400.png 将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的url。使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。