网络智能体-数据清洗:数据清洗算子能力概览

时间:2023-11-01 16:15:17

数据清洗算子能力概览

数据清洗算子能力介绍,如表1所示。

表1 数据清洗算子能力

算子名称

说明

去除空值

如果特征列中存在空值,执行“去除空值”算子,会删除空值行数据。操作请参考去除空值

空值填充

如果用户可以根据特征等信息推断出空值处的实际值,则可通过“空值填充”算子,替换空值。操作请参考空值填充

数据替换

如果特征列中的数据有误或者与用户的心理预期不符,可以通过“数据替换”算子,进行批量替换。操作请参考数据替换

数据映射

已有特征列保持不变的情况下,将选中特征列数据,映射生成一个新特征列。

操作请参考数据映射

数据过滤

如果数据存在误差,比如只能为正数的特征,存在负值,可通过“数据过滤”算子,将负值所在行过滤掉。操作请参考数据过滤

去重

如果特征列中存在重复数据,可通过“去重”算子,删除重复的数据行。操作请参考去重

support.huaweicloud.com/usermanual-naie-training/naie_training_03_0027.html