检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
true:校正图片的倾斜角度 false:不校正图片的倾斜角度 支持任意角度的校正,未传入该参数时默认为“false”。 待识别图片如果存在倾斜,建议将此参数设置为“true”。 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result InsurancePolicyResult
指定PDF页码识别。传入该参数时,则识别指定页码的内容。如果不传该参数,则默认识别第1页。 说明: 如果需要指定PDF页码识别,请通过该参数传入页码。目前不支持通过extended_parameters参数指定票证PDF页码。 表5 支持票证类型 归属服务名称 参数值 类型描述 身份证识别
前提条件 开通网络图片识别。 参考本地调用,安装OCR Python SDK。并执行pip install fitz命令和pip install PyMuPDF==1.18.0命令安装依赖包。 登录访问密钥页面,获取AK、SK。可以新增访问密钥,或使用已有的访问密钥。访问密钥为credentials
cn-north-4.myhuaweicloud.com”。 project_id 是 项目ID,您可以从获取项目ID中获取。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。获取Token
true:返回各个文字块区域 false:不返回各个文字块区域 如果无该参数,系统默认不返回文字块区域。如果输入参数不是Boolean类型,则会报非法参数错误。 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result VehicleCertificateResult
com/api-ocr/zh-cn_image_0288038400.png 将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的url。使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。
返回对应PDF页的结果。 响应参数 根据识别的结果,可能有不同的HTTP响应状态码(status code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result VatInvoiceResult
解读识别结果 本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。 以下图识别结果为例,讲解图片内容如何与API的返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含
Python SDK。 以PyCharm为例,介绍如何安装SDK。 在PyCharm中新建一个项目,并单击左下方“Terminal”按钮。分别执行以下命令安装SDK(该SDK支持Python3及以上版本)。 # 安装核心库 pip install huaweicloudsdkcore # 安装OCR服务库
关闭身份证反光告警功能 响应参数 根据识别的结果,可能有不同的HTTP响应状态码(status code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result IDCardResult
cn-north-4.myhuaweicloud.com”。 project_id 是 项目ID,您可以从获取项目ID中获取。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。获取Token
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK
口,如能未及时进行版本切换,则无法使用产品服务。 接口转换过程不会对服务体验造成影响,所有接口无需重新开通服务,套餐包也可以继续使用,使用参数也无需修改。 APIs切换步骤 V1版本APIs清单请参见表1。仅支持V2版本的API不在此表中列举。 在进行版本替换时,请在您的业务代码中搜索“v1
ff。建议:使用OBS的URL进行请求。 "error_code":"ModelArts.4704","error_msg":"Obtaining the file from the OBS failed. "表示从OBS获取图片数据失败,请确保存储图片的OBS路径存在且可访问,
式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为“已开通”。 如果您需要调用对象存储服务(OBS)中的数据,请在开通服务页面进行服务授权。 图2 OBS服务授权 OCR服务开通后,可在控制台进行关闭。开通服务时,计费规则默认为“按需计费”。只有调用成功才会计费,
部署该解决方案会使用到如下资源: 创建用于上传发票的OBS桶,企业业务系统将员工报销的发票图片或者电子发票PDF文件上传到该桶。 创建用于存储发票识别与验真结果的OBS桶,企业业务系统定时从该桶中获取结果并处理。 函数工作流:用于实现调用文字识别服务的业务逻辑,当OBS桶收到上传的发票文件后,会自动通
cr 开始使用 在开始使用之前,请确保您安装的是最新版本的SDK。使用过时的版本可能会导致兼容性问题或无法使用最新功能。您可以通过运行以下命令来检查并更新SDK至最新版本。 npm list @huaweicloud/huaweicloud-sdk-core npm list @
对象存储服务(Object Storage Service,简称OBS)是稳定、安全、高效、易用的云存储服务。文字识别接口都涉及到对用户的数据处理,用户的大量数据采用OBS批量方式处理,可以提升云上处理的总体效率。 文字识别接口支持从OBS上采用临时授权或者匿名公开授权的方式获取数据并进行处理。
附录 获取项目ID 获取账号ID 配置OBS访问权限