AI开发平台MODELARTS-自动学习的每个项目对数据有哪些要求?:预测分析对数据集的要求

时间:2024-09-19 18:52:23

预测分析对数据集的要求

训练数据:
  • 训练数据列数一致,总数据量不少于100条不同数据(有一个特征取值不同,即视为不同数据)。
  • 训练数据列内容不能有时间戳格式(如:yy-mm-dd、yyyy-mm-dd等)的数据。
  • 如果某一列的取值只有一种,会被视为无效列。请确保标签列的取值至少有两个且无数据缺失。

    标签列指的是在训练任务中被指定为训练目标的列,即最终通过该数据集训练得到模型时的输出(预测项)。

  • 除标签列外数据集中至少还应包含两个有效特征列(列的取值至少有两个且数据缺失比例低于10%)。
  • 当前由于特征筛选算法限制,预测数据列建议放在数据集最后一列,否则可能导致训练失败。
support.huaweicloud.com/modelarts_faq/modelarts_05_4192.html