检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
定义预处理 使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并上传模板图片,详情请见上传模板图片。
选择数据 在使用第二相面积含量测定工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入基于第二相面积含量测定工作流创建的其他应用中已创建的数据集。 新建训练数据集 导入数据集 前提条件 已在视觉套
上传模板图片 在使用单模板工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪张图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传某一格式的发票图片作为模板,训练的文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。
选择数据 在使用通用实体抽取工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入在自然语言处理套件其他应用中已创建的文本数据集。 新建数据集 导入数据集 前提条件 已在自然语言处理套件控制台选择“
选择数据 在使用无监督车牌检测工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入基于无监督车牌检测工作流创建的其他应用中已创建的数据集。 新建训练数据集 导入数据集 前提条件 已在视觉套件控制台
以按需选择不同的资源类型。 “专属资源池”:提供独享的计算资源,不与其他用户共享,更加高效。使用专属资源池需要在ModelArts创建专属资源池。 计算节点规格 请根据界面提示选择需要使用的规格。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式
以按需选择不同的资源类型。 “专属资源池”:提供独享的计算资源,不与其他用户共享,更加高效。使用专属资源池需要在ModelArts创建专属资源池。 计算节点规格 请根据界面提示选择需要使用的规格。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式
以按需选择不同的资源类型。 “专属资源池”:提供独享的计算资源,不与其他用户共享,更加高效。使用专属资源池需要在ModelArts创建专属资源池。 计算节点规格 请根据界面提示选择需要使用的规格。 计算节点个数 设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式
无监督车牌检测工作流流程 表1 无监督车牌检测工作流说明 流程 说明 详细指导 准备数据 在使用无监督车牌检测工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS中。 准备数据 选择数据 在使用无监督车牌检测工作流开发应用时,您需要新建或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。
选择数据 在使用多语种文本分类工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入在自然语言处理套件其他应用中已创建的文本数据集。 新建数据集 导入数据集 前提条件 已在自然语言处理套件控制台选择
第二相面积含量测定工作流流程 表1 第二相面积含量测定工作流说明 流程 说明 详细指导 准备数据 在使用第二相面积含量测定工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS中。 准备数据 选择数据 在使用第二相面积含量测定工作流开发应用时,您需要新建或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。
图1 商品识别工作流流程 表1 商品识别工作流说明 流程 说明 详细指导 准备数据 在使用零售商品识别工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS中。 准备数据 选择数据 在使用零售商品识别工作流开发应用时,您需要新建或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。
入手动标注数据页面,针对“已标注”的数据进行核对和检查。针对标注错误的数据修改标注。 由于零售商品工作流标注数据时需要勾勒出商品形状,必须使用多边形标注框标注数据。 父主题: 零售商品识别工作流
在标注概览页单击右上方的“开始标注”,进入手动标注数据页面,针对“已标注”的数据进行核对和检查。针对标注错误的数据修改标注。 第二相面积含量测定工作流标注数据时必须使用多边形标注框标注数据。 后续操作 单击右下角的“下一步”,进入应用开发的“模型训练”步骤,详细操作指引请参见标注数据。 父主题: 第二相面积含量测定工作流
估”页面,开始训练模型。模型训练完成后,可在“应用开发>评估”页面评估分类器和模板,详情请见评估应用。 删除模板 如果已创建的模板应用不再使用,您可以删除模板释放资源。 在“应用开发>训练分类器”页面,选择模板,单击操作列的“删除”,弹出“确认删除”对话框,单击“确认”,删除模板。
“公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。 “专属资源池”:提供独享的计算资源,不与其他用户共享,更加高效。使用专属资源池需要在ModelArts创建专属资源池。 计算节点规格 如果资源池选择“公共资源池”,支持选择计算规格“CPU:2 核 8 Gi
效率。 一键式部署,快速输出高精度结构化数据。 多模板分类工作流 功能介绍 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。
文字识别模型,实现单模板图像的文字信息结构化提取。 图1 创建单模板流程 表1 创建单模板流程说明 流程 说明 详细指导 上传模板图片 在使用单模板工作流开发应用之前,需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板
手动框选参照字段:若手动框选了任意参照字段,将激活手动框选模式。 当识别图片的场景比较单一时,即只有一种模板,且参照字段不容易与其他文字混淆时,可以使用自动参照字段来简化模板制作过程,否则建议手动框选,详细步骤请参见操作步骤。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应
您也可以单击“应用开发”,切换至“应用开发”页面,查看应用开发配置。 图1 进入应用详情 查看应用资产 在“应用资产”页面下,可以查看当前应用的资产信息。 使用预置工作流开发应用,“应用资产”可查看“模板列表”和“自定义字段类型”。 图2 应用资产 在“应用资产>模板列表”页面下可以查看已创建的模板列表,操作列可执行如下操作: