检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通用图像分类工作流 工作流介绍 新建应用 准备数据 选择数据 训练模型 评估模型 部署服务 父主题: 视觉套件
支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。
查看训练详情 模型训练完成后,可在“模型训练”页面查看“训练详情”,包括“准确率变化情况”和“误差变化”。 图1 模型训练 模型如何提升效果 检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量
准备数据 在使用通用图像分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计图像分类标签 首先使用的数据需要考虑好分类的标签类型,即希望识别出图片中的一种结果。例如对天气现象图片进行分类时,标签可以以“snow”(雪)、“rainy”(雨)等作为分类的类别。
选择数据 在使用通用图像分类工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入基于通用图像分类工作流创建的其他应用中已创建的数据集。 新建训练数据集 导入已有数据集 前提条件 通用图像分类工作流支持
已在“工业智能体控制台>工业AI开发>工业AI开发工作流”选择“通用图像分类工作流”新建应用,并训练模型,详情请见训练模型。 评估模型 在“模型评估”页面,您可以针对当前版本的模型进行模型评估,查看评估参数对比和详细评估,也可以模拟在线测试。 图1 评估模型 模型评估 “模型评估”下侧显示当前模型的版本、验证集数量。
默认进入“工业AI开发工作流”页签。 图1 工作台 在“工业AI开发工作流”页面下,单击“新建”。 进入“新建应用”页面。 根据业务需求填写“基本信息”、“工作流配置”和“资源配置”。 基本信息 包括“应用名称”(必填项)、“应用负责人”和“应用描述”。 图2 基本信息 工作流配置 选择“所属行业”和“选择工作流”。
部署服务 评估模型后,就可以部署服务,开发通用图像分类的专属应用,此应用用于识别输入图像的类型,也可以直接调用对应的API和SDK识别。 前提条件 已在“工业智能体控制台>工业AI开发>工业AI开发工作流”选择“通用图像分类工作流”新建应用,并评估模型,详情请见评估模型。 由于部
I开发工作流”新建应用,详细操作请见新建应用。您可以开发通用图像分类模型,自主上传数据训练模型,实现图像分类功能。 图1 通用图像分类工作流流程 表1 通用图像分类工作流说明 流程 说明 详细指导 准备数据 在使用通用图像分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS中。
在“应用开发>评估”页面,您可以选择本地上传测试图片,也可以上传在线图片。 图3 评估分类器 本地上传图片 默认进入“本地上传”页签,根据自身需要选择打开“分类模式”和“动态识别”开关,单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 “分类模式”:打开“分类
实现多模板图像的文字信息结构化提取。 图1 创建多模板流程 表1 创建多模板流程说明 流程 说明 详细指导 上传模板图片 在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理
模板分类器的训练集、用于评估模板的图片,图片要求如下: 只支持PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在100px到4096px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。 支持图像任意角度的水平旋转。 目前不支持
通用单模板工作流 通过构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 多模板分类工作流 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 详细介绍请见产品介绍>文字识别套件。
例如,文本文件的内容如下所示。标注对象与标注内容之间采用Tab键分隔。 华为通过不断的技术创新,来应对来自全球的挑战 科技 最近科技创业公司纷纷上市科创板 科技,经济 上传数据至OBS 使用ModelArts Pro进行应用开发时,您需要将数据上传至OBS桶中。 首先需要获取
传训练数据,快速训练高精度算法模型,并且一键部署至设备。 HiLens安全帽检测技能 功能介绍 面向智慧园区的安全帽检测技能,支持自主上传图片数据,构建高精度安全帽检测模型,快速开发安全帽检测技能,实现园区自动检测工人未戴安全帽的行为。 适用场景 智慧园区。 优势 模型精度高,检测速度快,更新模型简便。
接发布模板,页面显示“恭喜您,已发布成功”。 图1 部署模板 发布模板后,在“应用开发>部署”页面,您可以进行如下操作。 “评估”:单击“评估”,继续上传测试图片评估模板。 “继续编辑”:单击“继续编辑”,返回“应用开发>上传模板图片”页面,重新创建模板。 “返回列表”:单击“返回列表”,返回至应用详情页。
满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件提供预置工作流供您选择,全流程可视化完成AI应用开发以及持续迭代。 选择预置工作流 单模板工作流 通过工作流指引构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。详情请见使用单模板工作流开发应用。
默认进入“新增模板配置”页签。 图4 新增模板配置 单击添加多个模板,针对每个模板,选择模板类型,并且上传图片。 “上传图片”:单击“上传图片”区域,或鼠标直接拖拽图片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。 “修改模板名称”:单击图片右侧的,在弹出的输入框中输入新的模板名称,单击“确认”。
被标注文件的文件名。 size 是 表示图像的像素信息。 width:必选字段,图片的宽度。 height:必选字段,图片的高度。 depth:必选字段,图片的通道数。 segmented 是 表示是否用于分割。 mask_source 否 表示图像分割保存的mask路径。 object
进入“应用开发”页面,开始开发应用。 图1 应用开发 上传模板图片 在“应用开发>上传模板图片”页面,配置如下信息: 图2 上传模板图片 “模板名称”:输入模板名称。 “上传图片”:单击“上传图片”区域,或鼠标直接拖拽图片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。