AI开发平台MODELARTS-自动学习的每个项目对数据有哪些要求?:图像分类对数据集的要求

时间:2024-11-06 21:52:53

图像分类对数据集的要求

  • 文件名规范:不能有+、空格、制表符。
  • 保证图片质量:不能有损坏的图片,目前支持的格式包括jpg、jpeg、bmp、png。
  • 不要把明显不同的多个任务数据放在同一个数据集内。
  • 每一类数据尽量多,尽量均衡。期望获得良好效果,图像分类项目中,至少有两种以上的分类,每种分类的样本不少于20张。
  • 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。
  • 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。
  • 在上传数据时,请选择非加密桶进行上传,否则会由于加密桶无法解密导致后期的训练失败。
  • 用于训练的图片,至少有2种以上的分类,每种分类的图片数不少20张。
support.huaweicloud.com/modelarts_faq/modelarts_05_4192.html