网络智能体-数据清洗:数据清洗算子能力概览
数据清洗算子能力概览
数据清洗算子能力介绍,如表1所示。
算子名称 |
说明 |
---|---|
去除空值 |
如果特征列中存在空值,执行“去除空值”算子,会删除空值行数据。操作请参考去除空值。 |
空值填充 |
如果用户可以根据特征等信息推断出空值处的实际值,则可通过“空值填充”算子,替换空值。操作请参考空值填充。 |
数据替换 |
如果特征列中的数据有误或者与用户的心理预期不符,可以通过“数据替换”算子,进行批量替换。操作请参考数据替换。 |
数据映射 |
已有特征列保持不变的情况下,将选中特征列数据,映射生成一个新特征列。 操作请参考数据映射。 |
数据过滤 |
如果数据存在误差,比如只能为正数的特征,存在负值,可通过“数据过滤”算子,将负值所在行过滤掉。操作请参考数据过滤。 |
去重 |
如果特征列中存在重复数据,可通过“去重”算子,删除重复的数据行。操作请参考去重。 |