检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
行文字信息的提取和录入,降低人工录入成本。 支持区域: 华北-北京四 通用文字识别API 网络图片识别 支持识别网络图片中的所有印刷体、艺术字等文字信息,可识别中英文及部分繁体字以及常见网络图片如:手机截图、电脑截图、电商产品图及广告设计图等互联网图片,能够返回位置坐标和置信度,
属的API,详细操作请参见视频指导。 服务部署区域是从地理位置和网络时延维度划分,同一个区域内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。对于OCR服务,不同的
com/api-ocr/zh-cn_image_0288038182.png OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。
在“应用开发>上传模板图片”页面,输入多模板分类器的“名称”和“描述”。 图3 上传模板图片 然后上传模板图片,可选择新增模板配置。 新增模板配置 新增模板配置 默认进入“新增模板配置”页签。 图4 新增模板配置 单击添加多个模板,针对每个模板,选择模板类型,并且上传图片。 “上传图片”:单击“上传图片”区域
本示例将PDF文件转换为图片,并调用网络图片识别API,获取识别结果。 前提条件 开通网络图片识别。 参考本地调用,安装OCR Python SDK。并执行pip install fitz命令和pip install PyMuPDF==1.18.0命令安装依赖包。 登录访问密钥页面,获
化业务系统,提升业务效率。调用API时,需要用户网络可以访问公网。 您可以使用本文档提供文字识别服务API的描述、语法、参数说明及样例等内容,进行相关操作,例如文字识别包含的通用类、证件类和票据类等具体接口使用说明。不同区域所部署的接口不同,详情请参见终端节点;接口所支持的全部操作请参见2
t_id}/ocr”。其中,{project_id}为项目ID,可以登录我的凭证页面获取。项目ID需要依据实际的OCR部署区域进行填写,例如在图1中,OCR部署区域为“cn-north-4”,即{project_id}填充为cn-north-4区域对应的项目ID。 图1 代码示例
提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。 手写文字识别 识别文档中的手写文字信息,并将识别的结构化结果返回给用户。 网络图片识别 自动识别网络图片内的所有文字及其对应位置信息,如果图片包含联系人信息,也支持联系人信息的提取,同时可供进一步的数据挖掘后处理操作。 印章识别
自动化部署步骤 登录华为云解决方案实施库,选择“一键部署”。 图1 一键部署发票识别与验真 在选择模板界面中,直接单击“下一步:配置参数”。 图2 选择模板 在配置参数界面中,自定义填写堆栈名称。根据表完成参数配置后,单击“下一步:高级配置”。 图3 配置参数 表1 参数说明 参数名称
增值税普通发票、增值税电子普通发票以及增值税普通发票(卷票)四种类型发票的识别与验真。 网络货运 该实践基于华为云文字识别 OCR和人证核身服务 IVS AI技术构建,提供了一个开箱即用的网络货运认证解决方案,支持以下六种场景:身份证、行驶证、驾驶证、道路运输证、道路运输从业资格证的审查和人证核身。
少的权限。例如,下图报ocr:webImage:subscribe permission required错误(开通网络图片识别的权限)。 图2 IAM用户缺少网络图片识别权限 出现此类报错,IAM用户可联系主账户开通相应的服务。或者由主账户使用OCR自定义策略,帮助IAM用户开通权限后,IAM用户自行开通服务。
编辑应用 对于已经创建的模板应用,您可以修改模板的配置信息以匹配业务变化。 前提条件 已存在创建的模板应用。 编辑模板配置信息 登录“文字识别>自定义OCR”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。
编辑应用 对于已经创建的模板应用,您可以修改模板的配置信息以匹配业务变化。 前提条件 已存在创建的模板应用。 编辑模板配置信息 登录“文字识别>自定义OCR”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。
API 智能文档解析 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 印章识别 身份证识别 户口本识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 不动产证识别 车辆合格证识别 道路运输从业资格证识别 车牌识别 名片识别 VIN码识别
查看应用详情 创建应用后,您可以在“文字识别->自定义OCR”控制台查看应用详情,包括应用开发的配置信息和应用资产。 前提条件 已在“自定义OCR控制台”选择预置工作流创建应用,详情请见创建应用。 进入应用详情页 登录“文字识别”管理控制台,单击左侧菜单的“自定义OCR”。 进入
l路径。 如果您使用图片的url路径,可以将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的图片url。 关于OBS的使用请参考配置OBS访问权限。 OCR识别OBS私有桶中的图片时需要保证调用OCR服务的账号和调用OBS服务的账号为同一个。 同时,您也可以不使用华为云存储,使用公网http/https
当您的套餐包OCR资源到期未续费,首先会进入宽限期,资源状态变为“已过期”。宽限期内客户可正常访问及使用云服务,但以下操作将受到限制: 不可重置套餐包方式的API接口,例如“网络图片识别10万次套餐包”,在欠费后如果套餐包有剩余,可继续使用,但不可购买,也不可续期。 无法开通服务。 为了避免影响业务正常使用,请您在
响应消息体的MIME类型。 响应消息体 响应消息体通常以结构化格式返回,与响应消息头中Content-type对应,传递除响应消息头之外的内容。 对于网络图片识别接口,返回如下消息体。 { "result": { "words_block_count": 2,
)。 图2 我的凭证 安装SDK 使用SDK前需要安装华为云Go SDK 库。 // 安装华为云 Go SDK 库 go get github.com/huaweicloud/huaweicloud-sdk-go-v3 开始使用 在开始使用之前,请确保您安装的是最新版本的SDK。
工作流”。 确认模板类型后,要准备一张文字清晰的图作为模板图片,模板图中要包含业务需要定制识别的字段。例如上传某一格式的发票图片作为模板,配置文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已在“自定义OCR”控制台选择“通用单模板工作流”创建应用,详情请见6.2新建应用。