检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通用图像分类工作流 工作流介绍 新建应用 准备数据 选择数据 训练模型 评估模型 部署服务 父主题: 视觉套件
支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。
进入“应用开发”页面,开始开发应用。 图1 应用开发 上传模板图片 在“应用开发>上传模板图片”页面,配置如下信息: 图2 上传模板图片 “模板名称”:输入模板名称。 “上传图片”:单击“上传图片”区域,或鼠标直接拖拽图片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。
默认进入“新增模板配置”页签。 图4 新增模板配置 单击添加多个模板,针对每个模板,选择模板类型,并且上传图片。 “上传图片”:单击“上传图片”区域,或鼠标直接拖拽图片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。 “修改模板名称”:单击图片右侧的,在弹出的输入框中输入新的模板名称,单击“确认”。
在“工业视觉平台”控制台页面选择“工业AI开发>工业AI开发工作流”新建应用,详细操作请见新建应用。您可以开发通用图像分类模型,自主上传数据训练模型,实现图像分类功能。 图1 通用图像分类工作流流程 表1 通用图像分类工作流说明 流程 说明 详细指导 准备数据 在使用通用图像分类工作
新的流程自动化,只需要客户自己上传标注图片,就可以在线完成模型训练、评估、发布。 图3 零售场景 物流场景 物流场景需要处理各种格式的票据图片,用户可以通过简单的标注生成自己的专属模板,实现关键字段的自动识别和提取。 特点:对各种格式的票据图片,可制作模板实现关键字段的自动识别和提取。
部署服务 评估模型后,就可以部署服务,开发通用图像分类的专属应用,此应用用于识别输入图像的类型,也可以直接调用对应的API和SDK识别。 前提条件 已在“工业智能体控制台>工业AI开发>工业AI开发工作流”选择“通用图像分类工作流”新建应用,并评估模型,详情请见评估模型。 由于部
已在“工业智能体控制台>工业AI开发>工业AI开发工作流”选择“通用图像分类工作流”新建应用,并训练模型,详情请见训练模型。 评估模型 在“模型评估”页面,您可以针对当前版本的模型进行模型评估,查看评估参数对比和详细评估,也可以模拟在线测试。 图1 评估模型 模型评估 “模型评估”下侧显示当前模型的版本、验证集数量。
选择数据 在使用通用图像分类工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入基于通用图像分类工作流创建的其他应用中已创建的数据集。 新建训练数据集 导入已有数据集 前提条件 通用图像分类工作流支持
查看训练详情 模型训练完成后,可在“模型训练”页面查看“训练详情”,包括“准确率变化情况”和“误差变化”。 图1 模型训练 模型如何提升效果 检查是否存在训练数据过少的情况,建议每个类别的图片量不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量
HiLens套件 HiLens为端云协同AI应用开发平台,提供简单易用的开发框架、开箱即用的开发环境、丰富的AI技能市场和云上管理平台,帮助用户高效开发多模态AI技能,并将其快速部署到端侧计算设备。 HiLens套件提供可训练技能模板开发技能,无需代码,只需自主上传训练数据,快速
准备数据 在使用通用图像分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计图像分类标签 首先使用的数据需要考虑好分类的标签类型,即希望识别出图片中的一种结果。例如对天气现象图片进行分类时,标签可以以“snow”(雪)、“rainy”(雨)等作为分类的类别。
通用单模板工作流 通过构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 多模板分类工作流 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 详细介绍请见产品介绍>文字识别套件。
默认进入“工业AI开发工作流”页签。 图1 工作台 在“工业AI开发工作流”页面下,单击“新建”。 进入“新建应用”页面。 根据业务需求填写“基本信息”、“工作流配置”和“资源配置”。 基本信息 包括“应用名称”(必填项)、“应用负责人”和“应用描述”。 图2 基本信息 工作流配置 选择“所属行业”和“选择工作流”。
排,快速实现应用的开发、共享和发布,共建开放生态,实现普惠行业AI落地。 ModelArts Pro应用开发套件包括自然语言处理套件、文字识别套件等,能够快速响应不同行业、不同场景的AI落地需求。 应用开发 应用开发面向企业和行业用户开放,提供特定行业场景的预置行业工作流,用户基
实现多模板图像的文字信息结构化提取。 图1 创建多模板流程 表1 创建多模板流程说明 流程 说明 详细指导 上传模板图片 在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理
工作流介绍 工作流简介 功能介绍 支持上传多种刹车盘图片数据,构建刹车盘的识别模型,用于快速、准确的识别刹车盘类型。 支持一键部署模型和技能到边缘设备Atlas 500,并在华为HiLens平台上进行模型管理和技能管理。 适用场景 汽车改装等场景。 优势 模型精度高,识别速度快;更新模型简便。
在“应用开发>评估”页面,您可以选择本地上传测试图片,也可以上传在线图片。 图3 评估分类器 本地上传图片 默认进入“本地上传”页签,根据自身需要选择打开“分类模式”和“动态识别”开关,单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 “分类模式”:打开“分类
例如,文本文件的内容如下所示。标注对象与标注内容之间采用Tab键分隔。 华为通过不断的技术创新,来应对来自全球的挑战 科技 最近科技创业公司纷纷上市科创板 科技,经济 上传数据至OBS 使用ModelArts Pro进行应用开发时,您需要将数据上传至OBS桶中。 首先需要获取
模板分类器的训练集、用于评估模板的图片,图片要求如下: 只支持PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在100px到4096px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。 支持图像任意角度的水平旋转。 目前不支持