检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用单模板工作流开发应用 ModelArts Pro的文字识别套件提供了通用单模板工作流,通过工作流指引可构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。 本章节提供一个身份证样例,帮助您快速熟悉使用文字识别套件中的通用单模板工作流开发应用的过程。
使用多模板工作流开发应用 ModelArts Pro的文字识别套件提供了多模板工作流,通过工作流指引支持自定义多个文字识别模板,通过模型训练,自动识别图片所属模板,从而支持从大量不同板式图像中提取结构化信息。 本章节提供一个票证类型的样例,帮助您快速熟悉使用文字识别套件中的多模板
评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。一次性很难获得一个满意的模型,需要反复的调整算法、数据,不断评估训练生成的模型。 一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在视觉套件控制台选
刹车盘识别工作流 工作流介绍 准备数据 选择数据 训练模型 评估模型 部署服务 父主题: 视觉套件
准备数据 在使用云状识别工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计云状标签 首先需要考虑好云状标签,即希望识别出云状的一种结果。例如可以以“cumulus”(积云)、“stratus”(层云)、“cumulonimbus”(积雨云)等分别作为云状的种类。
无监督车牌检测工作流 工作流介绍 准备数据 选择数据 训练模型 评估模型 部署服务 父主题: 视觉套件
申请行业套件 目前ModelArts Pro已开通自然语言处理套件、视觉套件、文字识别套件、HiLens套件,其中文字识别套件和自然语言处理套件已商用,可直接进入套件使用,视觉套件和HiLens处于公测阶段,首次使用套件需要申请套件开通公测权限。 申请套件 针对处于公测阶段的套件,需要申请套件开通公测权限。
更新应用版本 一个模型很难一次性就训练到最佳的效果,可能需要结合模型评估报告和校验结果不断扩充数据和调优。 因此ModelArts Pro提供版本更新的功能,首次版本为v1,然后v2、v3......以此类推。可以通过调整训练数据和算法,多次训练,获得更好的模型效果。 每修改一次
名。 示例如下所示,其中“snow”和“rainy”分别为标签名。 dataset-import-example ├─snow │ 10.jpg │ 11.jpg │ 12.jpg │ └─rainy 1.jpg
部署服务 评估模板应用后,就可以部署模板应用至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在“应用开发>部署”页面完
部署服务 评估模板应用后,就可以部署多模板应用至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在
自动标注数据 针对已经选择的数据和SKU,在应用开发的“数据标注”页面,ModelArts Pro会自动标注数据,自动标注完成后,可对每个数据的标注结果进行核对和确认。 前提条件 已在视觉套件控制台选择“零售商品识别工作流”新建应用,并已执行到“SKU创建”步骤,详情请见创建SKU。
训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练实体抽取模型。 前提条件 已在自然语言处理套件控制台选择“通用实体抽取工作流”新建应用,并选择训练数据集,详情请见选择数据。 训练模型 图1 模型训练 在“模型训练”页面配置训练参数,开始训练模型。
准备数据 在使用第二相面积含量测定工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 数据标签 标注基于ModelArts的图像分割标注基础能力,由于第二相边界多为不规则形状,目前采用多边形标注第二相,标签为“second_phase”。 数据集要求 文件
标注数据 针对已经选择的数据,在应用开发的“数据标注”页面,ModelArts Pro会自动标注数据,自动标注完成后,可对每个数据的标注结果进行核对和确认。 前提条件 已在视觉套件控制台选择“第二相面积含量测定工作流”新建应用,详情请见标注数据。 自动标注数据 在“数据标注”页面
准备数据 在使用安全帽检测技能模板开发技能之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括jpg、jpeg、bmp、png。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。
部署服务 评估模型后,就可以部署服务,开发识别云状类型的专属应用,此应用用于识别云状的类型,进而用于气象预测工作,也可以直接调用对应的API和SDK识别。 前提条件 已在视觉套件控制台选择“云状识别工作流”新建应用,并评估模型,详情请见评估模型。 由于部署服务涉及ModelArts功能,需消耗资源,要确保账户未欠费。
文字识别套件 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
选择数据 在使用HiLens安全帽检测工作流训练模型时,您需要新建训练数据集,后续训练模型操作是基于您选择的训练数据集。 前提条件 已在ModelArts Pro控制台选择“HiLens安全帽检测”可训练模板新建技能,详情请见新建可训练技能。 已准备数据并上传至OBS,详情请见准备数据。
训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练安全帽检测模型。 前提条件 已创建用于存储数据的OBS桶及文件夹,且数据存储的OBS桶与ModelArts Pro在同一区域,详情请见创建OBS桶。 已在ModelArts Pro控制台选择“HiL