检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
”,以及合并标签后新的“标签名”。 图3 合并标签 查看标签解析 新建并选择训练数据集后,针对已标注的数据,您可以在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图4 标签解析 后续操作 在“数据选择”页面选择训练数据集,并针对未标注的数
”,以及合并标签后新的“标签名”。 图5 合并标签 查看标签解析 新建并选择训练数据集后,针对已标注的数据,您可以在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图6 标签解析 后续操作 在“数据选择”页面选择训练数据集,并针对未标注的数
角的“开始标注”,在“数据标注”页面手动标注数据。 查看标签解析 新建并选择训练数据集后,针对已标注的数据,您可以在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图3 标签解析 后续操作 在“数据选择”页面选择训练数据集,并针对未标注的数
右上角的“开始标注”,在“数据标注”页面手动标注数据。 查看标签解析 新建并选择训练数据集后,针对已标注的数据,在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图5 标签解析 后续操作 选择训练数据集后,单击右下角的“下一步”,进入应用开
页单击右上角的“开始标注”,在“数据标注”页面手动标注数据。 勾选当前应用开发所需的训练数据集。 查看标签解析 新建并选择训练数据集后,针对已标注的数据,您可以在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 后续操作 在“数据选择”页面选
热轧钢板表面缺陷检测工作流标注数据时,必须使用矩形标注框标注数据。 查看标签解析 新建并选择训练数据集后,针对已标注的数据,在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图5 标签解析 后续操作 选择训练数据集后,单击右下角的“下一步”,进入应用开
右上角的“开始标注”,在“数据标注”页面手动标注数据。 查看标签解析 新建并选择训练数据集后,针对已标注的数据,在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图5 标签解析 后续操作 选择训练数据集后,单击右下角的“下一步”,进入应用开
数据标注页面,开始手动标注数据。 图6 数据集标注任务 查看标签解析 新建并选择训练数据集后,针对已标注的数据,在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图7 标签解析 后续操作 选择训练数据集后,单击右下角的“下一步”,进入应用开
自动标注数据 单击“下一步”,创建SKU后,自动标注数据。 查看标签解析 新建并选择训练数据集后,针对已标注的数据,在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图5 标签解析 后续操作 在“数据选择”页面选择训练数据集,针对未标注的数据进
的OBS桶和文件夹“/mapro-hilens/training-data-out”。 勾选当前应用开发所需的训练数据集。 下方可查看标签解析。 图3 选择数据集 单击右下角的“下一步”。 进入“模型训练”步骤。 步骤4:训练模型 在“模型训练”页面,按表2配置训练参数,然后单击“开始训练”。
评估应用 训练模板分类模型后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
工作流介绍 工作流简介 功能介绍 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别
使用多模板工作流开发应用 ModelArts Pro的文字识别套件提供了多模板工作流,通过工作流指引支持自定义多个文字识别模板,通过模型训练,自动识别图片所属模板,从而支持从大量不同板式图像中提取结构化信息。 本章节提供一个票证类型的样例,帮助您快速熟悉使用文字识别套件中的多模板
编辑应用 对于已经创建的模板应用,您可以修改模板的配置信息以匹配业务变化。 前提条件 已存在创建的模板应用。 编辑模板配置信息 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
选择步骤1:准备数据中提前创建好的输出数据集的OBS路径“mapro-vison/data-out”。 勾选已上传的数据集。 由于本样例上传的数据为未标注数据,因此标签解析出数据集共有0个标签,0条有效样本数据。 单击右下角“下一步”。 进入“应用开发>SKU创建”页面。 步骤4:创建SKU 在“SKU创建”页面,单击“批量上传SKU”。
选择步骤1:准备数据中提前创建好的输出数据集的OBS路径“mapro-nlp/data-out”。 勾选已上传的数据集。 服务进行标签解析,统计训练数据集中各个标签的样本数。 您可以选择打开“合并标签”开关,将样本数量较少的标签在模型训练中进行合并,以达到更优训练效果。 图7
行业套件介绍 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件的介绍请参见产品介绍。 预置工作流 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别