检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并上传模板图片,详情请见上传模板图片。
使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并上传模板图片,详情请见上传模板图片。 定义预处理
接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明、隐私政策声明。 文字识别服务等级协议请参见华为云服务等级协议。 OCR能力 通用类 OCR 通用类OCR(General OCR),支持表格、文档、网络图片等任意格式图片上文字信息的自动
网络图片识别功能优化 网络图片识别服务性能提升1倍。 商用 - 4 价格更新 OCR线上服务降价50%。 商用 - 5 移动端界面适配 华为云移动端控制台界面适配,支持移动端便捷购买套餐包。 商用 - 2020年2月 序号 功能名称 功能描述 阶段 相关文档 1 车牌识别功能优化
面,依次完成“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”步骤,单击“下一步”,进入“评估”页面。 本地上传图片 图2 评估模板 在“应用开发>评估”页面,默认进入“本地上传”页签。 单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。
已在“自定义OCR控制台”选择“通用单模板工作流”创建应用,并对上传的模板图片进行预处理,详情请见定义预处理。 操作步骤 图1 框选参照字段 在“应用开发>框选参照字段”页面,通过单击左上方操作图标,调整模板图片到合适大小。 单击框选操作图标,单击参照字段左上角,移动鼠标,使得矩形框覆盖参照字段。
图1 创建单模板流程 表1 创建单模板流程说明 流程 说明 详细指导 上传模板图片 在使用单模板工作流开发应用之前,需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。
已在自定义OCR控制台选择“多模板分类工作流”创建应用,并对上传的模板图片进行预处理,详情请见定义预处理。 操作步骤 图1 多模板框选参照字段 在“应用开发>框选参照字段”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。 单击左上方操作图标,调整当前模板图片到合适大小和位置。 单击框选操作
图1 创建多模板流程 表1 创建多模板流程说明 流程 说明 详细指导 上传模板图片 在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。
“编辑”。 图2 编辑模板 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“模板总览”、“评估”、“调用指南”步骤的信息,重新部署模板。操作指引如下: 上传模板图片 定义预处理 框选参照字段 框选识别区 模板总览 评估 调用指南
在“模板列表”页签,选择模板名称,单击操作列的“编辑”。 图2 模板列表 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“评估”步骤的信息,重新编辑模板。操作指引如下: 上传模板图片 定义预处理 6.3.4-框选参照字段 6.3.5-框选识别区 6.3.6-评估
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成评估模板步骤,详情请见评估。 操作步骤 在“应用开发>评估”页面完成模板评估后,单击“下一步”
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并完成评估模板步骤,详情请见评估. 操作步骤 在“应用开发>调用指南”页面完成
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数
与image二选一。 图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 return_text_location
识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。 关于如何压缩图片,请参考以下代码。
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数
对象存储服务 对象存储服务(Object Storage Service,简称OBS)是稳定、安全、高效、易用的云存储服务。文字识别接口都涉及到对用户的数据处理,用户的大量数据采用OBS批量方式处理,可以提升云上处理的总体效率。 文字识别接口支持从OBS上采用临时授权或者匿名公开授权的方式获取数据并进行处理。
IAM权限 IAM权限是作用于云资源的,IAM权限定义了允许和拒绝的访问操作,以此实现云资源权限访问控制。管理员创建IAM用户后,需要将用户加入到一个用户组中,IAM可以对这个组授予OCR所需的权限,组内用户自动继承用户组的所有权限。 委托授权 如果用户想使用存储在对象存储服务(OBS
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数