正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
解读识别结果 本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。 以下图识别结果为例,讲解图片内容如何与API的返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含
电子发票PDF文件到华为云OBS桶后,即可自动进行文字识别和验真,企业业务系统只需定时从存储结果的OBS桶中获取结果,即可实现发票报销的自动化处理流程。SDK详细使用流程可参考OBS SDK用户指南。 结果示例 示例发票 示例结果 发票识别与验真结果如下所示,'status'字段
识别结果后处理 提取特定字段导入Excel 本示例调用身份证识别API,并从获取到的JSON结果中,提取所需的字段,填入至Excel。 前提条件 开通身份证识别。 参考本地调用,安装OCR Python SDK。并执行pip install xlsxwriter命令安装依赖包。
获取识别结果 解读识别结果 识别结果后处理
对服务进行访问。若未对服务授权,则无法直接获取到用户数据,需要用户开启公共读授权或者提供一个临时授权的URL。 对文字识别服务开启授权 如果您需要使用OBS中的数据,请开通对象存储服务OBS授权。进入文字识别控制台。打开对象存储服务OBS授权的按钮,完成授权操作。完成授权即可使用授权方式的URL对服务进行访问。
OCR服务支持上传图片后直接导出结果吗 目前OCR服务不支持上传图片后直接导出结果,需要通过调用API的方式使用。具体操作请参考《文字识别服务快速入门》。 父主题: 产品咨询类
使用OCR服务是否必须使用华为云存储图片 文字识别服务支持输入图片的base64编码或图片的url路径。 如果您使用图片的url路径,可以将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的图片url。 关于OBS的使用请参考配置OBS访问权限。 OCR识别OBS私有桶中的图片时需
OCR服务识别结果可以转化为Word、TXT、pdf吗 OCR提取之后返回的结果是JSON格式,需要用户通过编程,将结果保存为Word、TXT、pdf格式。 父主题: API使用类
部署该解决方案会使用到如下资源: 创建用于上传发票的OBS桶,企业业务系统将员工报销的发票图片或者电子发票PDF文件上传到该桶。 创建用于存储发票识别与验真结果的OBS桶,企业业务系统定时从该桶中获取结果并处理。 函数工作流:用于实现调用文字识别服务的业务逻辑,当OBS桶收到上传的发票文件后,会自动通
使用OCR服务需要的权限 使用OCR服务时,如果您需要使用华为云对象存储服务(OBS)中的数据,请开通对象存储服务OBS授权,可在控制台进行开通。 OCR服务支持IAM细粒度划分策略。可以为子用户设置OCR服务的使用权限。 父主题: 权限类
the file from the OBS failed. 获取OBS文件失败。 请检查OBS文件。 ModelArts.4705 The file stored on the OBS is oversized. OBS文件大小超限。 请检查OBS文件大小,请使用符合服务大小限制的文件作为输入。
调用OCR服务的区域可以与OBS资源的区域不一致吗 不支持跨区域OBS,OBS的区域需要和调用服务区域保持一致。 对于开启公共读授权的OBS资源公网可访问,可支持跨区域调用,虽然使用比较方便,但若对于敏感的信息,例如个人的私有数据,存在泄露风险。建议您调用的文字识别服务和OBS服务是在同一个区域。
服务开通之后开通状态显示「未开通」 问题现象 登录OCR控制台,为某个IAM用户开通智能分类识别,但是发现“开通状态”仍然显示未开通。 图1 为IAM用户开通智能分类识别 图2 开通状态 原因分析 上述操作是主账号或被授予所有权限(OCR FullAccess)的IAM子账号(用
如何修改返回结果的response类型 使用使用python调用OCR API获取response中的具体内容时,如果需要对返回结果的response类型进行修改。可以使用 to_dict()、to_str() 进行格式转换,to_dict()是转换为json格式,to_str()
参数名称 类型 是否可选 参数解释 默认值 image_bucket_name string 必填 桶名称,用于上传发票图片或PDF文件。 OBS桶名称,全局唯一,用于上传发票图片或PDF文件。取值范围:支持小写字母、数字、中划线(-)、英文句号(.)。 无默认值,桶名可以自定义。
OCR服务识别结果可以转化为Word、TXT、pdf吗 如何获取图片base64编码 OCR的并发是多少 调用OCR服务的区域可以与OBS资源的区域不一致吗 识别身份证正反面总计调用几次接口 如何提高识别精度 如何提高识别速度 pdf转图片方法 是否支持从非华为云存储中读取图片
b64encode函数等方法,获取图片的base64编码。 url 传入图片的url路径。 使用公网http/https url,例如https://support.huaweicloud.com/api-ocr/zh-cn_image_0288038400.png 将图片上传至华为云对象存储服务(OB
返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组数字代码,状态码表示了请求响应的状态,如果调用后返回状态码为2xx,则表示调用成功。完整的状态码列表请参见状态码。 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type”。例如表1所示。
N格式的识别结果。 使用流程 图1 使用流程 使用前必读 用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node.js编程语言。 OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通
是否支持从非华为云存储中读取图片 OCR服务支持读取公网http和https的图片地址,如果使用非华为云存储,请确保相应的图片可以通过公网进行访问。 父主题: API使用类