检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
定义预处理 使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并上传模板图片,详情请见上传模板图片。
选择数据 在使用第二相面积含量测定工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入基于第二相面积含量测定工作流创建的其他应用中已创建的数据集。 新建训练数据集 导入数据集 前提条件 已在视觉套
由于零售商品工作流标注数据时需要勾勒出商品形状,必须使用多边形标注框标注数据。 自动标注数据 单击“下一步”,创建SKU后,自动标注数据。 导入数据集 在“数据选择”页面,单击“导入数据集”。 弹出“导入数据集”对话框。 “导入数据集”对话框会显示您在零售商品识别工作流创建的其他应用中已使用的数据集信息,包括“数据集名称”和“标注进度”。
选择数据 在使用通用文本分类工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入在自然语言处理套件其他应用中已创建的文本数据集。 新建数据集 导入数据集 前提条件 已在自然语言处理套件控制台选择“
Pro在数据集管理过程中,针对同一个数据源,对不同时间标注后的数据,按版本进行区分,方便后续模型构建和开发过程中,选择对应的数据集版本进行使用。数据标注完成后,您可以将数据集当前状态进行发布,生成一个新的数据集版本。 关于数据集版本 针对刚创建的数据集(未发布前),无数据集版本信
选择数据 在使用云状识别工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入基于云状识别工作流创建的其他应用中已创建的数据集。 新建训练数据集 导入数据集 前提条件 云状识别工作流支持将服务一键部
上传模板图片 在使用单模板工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪张图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传某一格式的发票图片作为模板,训练的文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。
选择数据 在使用刹车盘识别工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入基于刹车盘识别工作流创建的其他应用中已创建的数据集。 新建训练数据集 导入数据集 前提条件 刹车盘识别工作流支持将服务
选择数据 在使用通用实体抽取工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入在自然语言处理套件其他应用中已创建的文本数据集。 新建数据集 导入数据集 前提条件 已在自然语言处理套件控制台选择“
选择数据 在使用无监督车牌检测工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入基于无监督车牌检测工作流创建的其他应用中已创建的数据集。 新建训练数据集 导入数据集 前提条件 已在视觉套件控制台
高精度的文字识别模型,保证结构化信息提取精度。 图1 使用预置工作流开发应用 表1 使用预置工作流开发应用流程 流程 说明 详细指导 选择文字识别套件 根据您的实际使用需求选择文字识别套件。您也可以通过查看工作流定位所需使用的套件。 在ModelArts Pro控制台界面,单击“
选择数据 在使用多语种文本分类工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入在自然语言处理套件其他应用中已创建的文本数据集。 新建数据集 导入数据集 前提条件 已在自然语言处理套件控制台选择
详细介绍请见产品介绍>视觉套件。 使用预置工作流开发应用流程 视觉套件提供了预置工作流,您可以通过预置的工作流,自主上传训练数据,构建和升级高精度识别模型。 图1 使用预置工作流开发应用 表1 使用预置工作流开发应用流程 流程 说明 详细指导 选择视觉套件 根据您的实际使用需求选择视觉套件。您
您在创建OBS桶时,需保证您的OBS桶与ModelArts Pro在同一个区域。 建议根据业务情况及使用习惯,选择OBS使用方法。 如果您的数据量较小(小于100MB)或数据文件较少(少于100个),建议您使用控制台上传数据。控制台上传无需工具下载或多余配置,在少量数据上传时,更加便捷高效。 如
入手动标注数据页面,针对“已标注”的数据进行核对和检查。针对标注错误的数据修改标注。 由于零售商品工作流标注数据时需要勾勒出商品形状,必须使用多边形标注框标注数据。 父主题: 零售商品识别工作流
在标注概览页单击右上方的“开始标注”,进入手动标注数据页面,针对“已标注”的数据进行核对和检查。针对标注错误的数据修改标注。 第二相面积含量测定工作流标注数据时必须使用多边形标注框标注数据。 后续操作 单击右下角的“下一步”,进入应用开发的“模型训练”步骤,详细操作指引请参见标注数据。 父主题: 第二相面积含量测定工作流
估”页面,开始训练模型。模型训练完成后,可在“应用开发>评估”页面评估分类器和模板,详情请见评估应用。 删除模板 如果已创建的模板应用不再使用,您可以删除模板释放资源。 在“应用开发>训练分类器”页面,选择模板,单击操作列的“删除”,弹出“确认删除”对话框,单击“确认”,删除模板。
效率。 一键式部署,快速输出高精度结构化数据。 多模板分类工作流 功能介绍 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。
文字识别模型,实现单模板图像的文字信息结构化提取。 图1 创建单模板流程 表1 创建单模板流程说明 流程 说明 详细指导 上传模板图片 在使用单模板工作流开发应用之前,需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板