企业级AI应用开发专业套件 MODELARTS PRO-视觉套件(使用零售商品识别工作流开发应用):步骤1:准备数据
步骤1:准备数据
在开发应用之前,您需要设计好商品标签,并自行准备数据集并上传至OBS桶及文件夹中。
由于数据安全原因,本样例不提供具体的样例数据,仅提供适用本次样例的数据要求。本次样例需要准备两份数据,一份训练数据集用于训练模型,一份SKU数据用于创建SKU,即商品各类单品的图片,方便后续针对训练数据集中的数据进行自动标注。
- 商品标签
本次样例以蛋糕商品为例,设计“cream_cake”、“fruit_cake”、“cheese_cake”这三类标签。
- 数据格式
- 保证图片质量:不能有损坏的图片。
- 目前支持的格式包括JPG、JPEG、PNG、BMP。
- 训练数据集
- 本样例训练数据集使用未标注数据。
- 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。
- 为保证模型的泛化能力,数据集尽量覆盖所有商品分类的图片,即覆盖所有标签的图片。
- 每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。
- 所有图片放在一个文件目录下,示例如下所示。
├─Training-Dataset │ IMG_20180919_114732.jpg │ IMG_20180919_114745.jpg │ IMG_20180919_114945.jpg
如果训练数据集使用已标注数据,数据要求请见数据集要求。