企业级AI应用开发专业套件 MODELARTS PRO-视觉套件(使用零售商品识别工作流开发应用):步骤1:准备数据

时间:2024-04-03 15:32:07

步骤1:准备数据

在开发应用之前,您需要设计好商品标签,并自行准备数据集并上传至OBS桶及文件夹中。

由于数据安全原因,本样例不提供具体的样例数据,仅提供适用本次样例的数据要求。本次样例需要准备两份数据,一份训练数据集用于训练模型,一份SKU数据用于创建SKU,即商品各类单品的图片,方便后续针对训练数据集中的数据进行自动标注。

  • 商品标签

    本次样例以蛋糕商品为例,设计“cream_cake”“fruit_cake”“cheese_cake”这三类标签。

  • 数据格式
    • 保证图片质量:不能有损坏的图片。
    • 目前支持的格式包括JPG、JPEG、PNG、BMP。
  • 训练数据集
    • 本样例训练数据集使用未标注数据。
    • 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。
    • 为保证模型的泛化能力,数据集尽量覆盖所有商品分类的图片,即覆盖所有标签的图片。
    • 每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。
    • 所有图片放在一个文件目录下,示例如下所示。
      ├─Training-Dataset 
      │      IMG_20180919_114732.jpg 
      │      IMG_20180919_114745.jpg 
      │      IMG_20180919_114945.jpg 

如果训练数据集使用已标注数据,数据要求请见数据集要求

support.huaweicloud.com/qs-modelartspro/modelartspro_04_0007.html