对于AI开发者而言,在开始模型训练前,都得提前准备大量的数据,完成数据标注后,才能用于AI模型构建。
一般情况下,模型构建对输入的训练数据都是有要求的,比如图像分类,一类标签的数据至少20条,否则您训练所得的模型无法满足预期。为了获得更好的模型,标注的数据越多,训练所得的模型质量更佳。
正因为如此,数据标注的工作显得有点繁重枯燥,数据多,工作重复。
ModelArts主打是一个易用、好用的AI平台,想AI开发者所想,智能标注功能,一键解决人工标注的烦恼。智能标注功能快速完成数据标注,为您节省70%以上的标注时间。智能标注是指基于当前标注阶段的标签及图片学习训练,选中系统中已有的模型进行智能标注,快速完成剩余图片的标注操作。
一键智能标注,怎么用?
- 在ModelArts管理控制台,选择“ 数据管理 >数据集”。
- 创建一个数据集,数据集类型需选择“图像分类”或“物体检测”类型。
- 单击数据集名称,进入数据集概览页。然后,单击右上角“开始标注”,进入数据集详情页。
- 在数据集详情页,单击“待确认”页签,然后单击“启动智能标注”。
- 在弹出的“启动智能标注”对话框中,选择智能标注类型。
智能标注有两种类型:
“主动学习”表示系统将自动使用半监督学习,难例筛选等多种手段进行智能标注,降低人工标注量,帮助用户找到难例。同时,可选择“快速型”或“精准型”的算法类型。“快速型”仅使用已标注的样本进行训练;“精准型”会额外使用未标注的样本做半监督训练,使得模型精度更高。
“预标注”表示选择用户模型管理里面的模型,选择模型时需要注意模型类型和数据集的标注类型相匹配。从当前账号管理的模型列表中选择一个匹配的模型,用于智能标注。
下图为“图像分类”类型的智能标注:
下图为“物体检测”类型的智能标注:
- 单击“提交”后,启动智能标注。
智能标注有哪些限制
- 目前只有“图像分类”和“物体检测”类型的数据集支持智能标注功能。
- 启动智能标注时,需数据集存在至少2种标签,且每种标签已标注的图片不少于5张。
- 启动智能标注时,必须存在未标注图片。
- 启动智能标注前,保证当前系统中不存在正在进行中的智能标注任务。
后续操作
智能标注结束后,所有标注好的数据都存储在待确认页面,您可以进去查看智能标注好的结果,进行批量确认。确认完成后,即完成了数据标注。