检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。 已在文字识别套件控制台选择“多模板分类工作流”新建应用,详情请见新建应用。
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
模板列表 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“评估”步骤的信息,重新部署模板。操作指引如下: 上传模板图片 定义预处理 框选参照字段 框选识别区 评估应用 部署服务 父主题: 通用单模板工作流
进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“训练分类器”、“评估”步骤的信息,重新部署模板。操作指引如下: 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 父主题: 多模板分类工作流
ject体。 name:必选字段,标注内容的类别。 pose:必选字段,标注内容的拍摄角度。 truncated:必选字段,标注内容是否被截断(0表示完整)。 occluded:必选字段,标注内容是否被遮挡(0表示未遮挡) difficult:必选字段,标注目标是否难以识别(0表示容易识别)。
容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。 框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。 框选识别区 评估应用
容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。 框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。 框选识别区 训练分类器
义OCR部署后生成的url,只使用图片中用蓝色标注的字段进行替换。 (3)将代码示例中的# option["side"]="front"替换为: option["template_id"]="xxx" template_id的值可以在自定义OCR部署发布后获取。 图6 修改代码文件(修改前)
单击图标,向右旋转图片90°。 :单击图标,缩小图片大小。 :单击图标,放大图片大小。 :单击选择图片放大比例。 处理完后,单击“下一步”,进入框选参照字段步骤。 父主题: 通用单模板工作流
单击图标,向右旋转图片90°。 :单击图标,缩小图片大小。 :单击图标,放大图片大小。 :单击选择图片放大比例。 处理完后,单击“下一步”,进入框选参照字段步骤。 父主题: 多模板分类工作流
零售场景 物流场景 物流场景需要处理各种格式的票据图片,用户可以通过简单的标注生成自己的专属模板,实现关键字段的自动识别和提取。 特点:对各种格式的票据图片,可制作模板实现关键字段的自动识别和提取。 优势:支持不同格式票据图片的自动识别和结构化提取。通过可视化界面操作,轻松指定识别区域,完成模板设计并调用服务接口。
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估应用 部署服务 自定义字段类型 编辑应用 删除应用 父主题: 文字识别套件
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
单击已有模板操作列的“评估”。进入“评估”页面。 图1 评估应用 在“应用开发”页面,依次完成“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“训练分类器”步骤,单击“下一步”,进入“评估”页面。 图2 评估应用 评估分类器 通过上传测试图片,在线评估模型训练的模板分类器是否能正确分类模板。
b键分隔。 手感很好,反应速度很快,不知道以后怎样 positive 三个月前买了一个用的非常好果断把旧手机替换下来尤其在待机方面秒杀 positive 没充一会电源怎么也会发热呢音量健不好用回弹不好 negative 算是给自己的父亲节礼物吧物流很快下单不到24小时就到
数据集状态 按上传的数据是否标注分为“已标注数据集”和“未标注数据集”。数据格式请见准备数据。 数据上传方式 训练数据上传的方式,当前仅支持把数据上传至OBS,默认为“选择obs文件”。 数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”右侧输入框,在弹出的“数据
数据集状态 按上传的数据是否标注分为“已标注数据集”和“未标注数据集”。数据格式请见数据集要求。 数据上传方式 训练数据上传的方式,当前仅支持把数据上传至OBS,默认为“选择obs文件”。 数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”右侧输入框,在弹出的“数据
型,自主更新和调整模型精度,实现高精度的安全帽检测功能,并一键安装技能至HiLens Kit设备。 HiLens安全帽检测技能 启动技能 把技能安装至设备后,可以直接在HiLens Studio中启动技能,查看技能运行效果。 启动或停止技能 父主题: HiLens套件
数据集名称 待新建的数据集名称。 本样例填写“data-cake”。 描述 数据集简要描述。 - 数据上传方式 训练数据上传的方式,当前仅支持把数据上传至OBS,默认为“选择obs文件”。 默认“选择obs文件”。 数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”
后续操作 更新版本后,您可以在“应用详情”页的开发版本列表查看当前应用各个版本的“版本名称”、“进展”、“模型精准率”、“模型召回率”、“F1值”、“更新时间”和可执行的“操作”。 图2 开发版本列表 父主题: 自然语言处理套件