检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
对文字识别服务开启授权 如果您需要使用OBS中的数据,请开通对象存储服务OBS授权。进入文字识别控制台。打开对象存储服务OBS授权的按钮,完成授权操作。完成授权即可使用授权方式的URL对服务进行访问。 图1 OBS授权 不支持跨区域OBS,OBS的区域需要和服务保持一致。 OBS特性的使用限制请参考约束与限制。
调用OCR服务的区域可以与OBS资源的区域不一致吗 不支持跨区域OBS,OBS的区域需要和调用服务区域保持一致。 对于开启公共读授权的OBS资源公网可访问,可支持跨区域调用,虽然使用比较方便,但若对于敏感的信息,例如个人的私有数据,存在泄露风险。建议您调用的文字识别服务和OBS服务是在同一个区域。
如果您使用图片的url路径,可以将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的图片url。 关于OBS的使用请参考配置OBS访问权限。 OCR识别OBS私有桶中的图片时需要保证调用OCR服务的账号和调用OBS服务的账号为同一个。 同时,您也可以不使用华为云存储,使用公网http/https
使用OCR服务需要的权限 使用OCR服务时,如果您需要使用华为云对象存储服务(OBS)中的数据,请开通对象存储服务OBS授权,可在控制台进行开通。 OCR服务支持IAM细粒度划分策略。可以为子用户设置OCR服务的使用权限。 父主题: 权限类
企业业务系统可通过华为云提供的SDK服务与OBS桶进行对接,当员工上传发票图片或者电子发票PDF文件到华为云OBS桶后,即可自动进行文字识别和验真,企业业务系统只需定时从存储结果的OBS桶中获取结果,即可实现发票报销的自动化处理流程。SDK详细使用流程可参考OBS SDK用户指南。 结果示例
API会提示ModelArts.4204报错。 使用文字识别服务时,可以通过配置OBS访问权限搭配使用。服务只需要配置一次即可,后面使用时无需再次配置,详细信息请参见配置OBS访问权限章节。 父主题: 如何调用API
如何通过主账号创建IAM账号 OCR服务支持IAM细粒度划分策略,主账号可以为子用户设置OCR服务的使用权限。 如果您需要将资源分配给企业中不同的员工或者应用程序使用,您可以使用IAM的用户管理功能,给员工或应用程序创建IAM用户。 父主题: 权限类
≥0次每分钟 文字识别 每个子服务都有调用成功次数和失败次数两个指标。 对象存储服务 对象存储服务(Object Storage Service,简称OBS)是稳定、安全、高效、易用的云存储服务。文字识别接口都涉及到对用户的数据处理,用户的大量数据采用OBS批量方式处理,可以提升云上处理的总体效率。
根据实际情况选填,参数部分可参考APIE界面的“接口文档”。 单击调试,在“调试结果”中查看调用结果。 图1 APIE在线调试 父主题: 如何调用API
如何查看审计日志 操作场景 在您开启了云审计服务后,系统开始记录云服务器的相关操作。云审计服务管理控制台保存最近7天的操作记录。 本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。 操作步骤 登录云审计服务控制台。 单击左侧导航树的“事件列表”,进入事件列表信息页面。 事
meet the requirements." } 其中,error_code表示错误码,error_msg表示错误描述信息。 父主题: 如何调用API
API使用类 如何查看API的使用量 为什么实际调用次数与界面记录次数不一致 API是否可以混用 OCR服务支持批量识别吗 OCR服务识别结果可以转化为Word、TXT、pdf吗 如何获取图片base64编码 OCR的并发是多少 调用OCR服务的区域可以与OBS资源的区域不一致吗
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
的计费方式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为“已开通”。 如果您需要调用对象存储服务(OBS)中的数据,请在开通服务页面进行服务授权。 图2 OBS服务授权 OCR服务开通后,可在控制台进行关闭。开通服务时,计费规则默认为“按需计费”。只有调用成功才
如何选购合适的API 文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。 除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别:提取图片内的文字及其对应位置信息。
如何关闭已申请的服务 主账号可在“开通管理”里控制子用户服务的开通、关闭。 服务开通后,如不再使用,可登录主账号在控制台单击“开通管理”进行关闭。 图1 服务关闭 父主题: 服务开通类
ff。建议:使用OBS的URL进行请求。 "error_code":"ModelArts.4704","error_msg":"Obtaining the file from the OBS failed. "表示从OBS获取图片数据失败,请确保存储图片的OBS路径存在且可访问,
如何选择OCR套餐包的区域 不同的地域之间资源包不互通,每个地域需分别购买,请根据您的实际需求慎重选择。各服务所部署区域请参见终端节点。 请先确定使用的服务与区域之后再购买相应区域的套餐包。 父主题: 服务开通类
如何修改返回结果的response类型 使用使用python调用OCR API获取response中的具体内容时,如果需要对返回结果的response类型进行修改。可以使用 to_dict()、to_str() 进行格式转换,to_dict()是转换为json格式,to_str()
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64