AI开发平台MODELARTS-准备数据:数据集要求

时间:2024-04-30 17:38:09

数据集要求

  • 文件名规范:不能有+、空格、制表符。
  • 保证图片质量:不能有损坏的图片,目前支持的格式包括jpg、jpeg、bmp、png。
  • 不要把明显不同的多个任务数据放在同一个数据集内。
  • 每一类数据尽量多,尽量均衡。期望获得良好效果,图像分类项目中,建议训练数据集保证每类图片超过100张。
  • 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。
  • 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。
support.huaweicloud.com/exemlug-modelarts/modelarts_21_0003.html