卡方
物联网大数据的五个特征
物联网 大数据 的五个特征,如在此基础上时,通过特征工程将一个数据插入,并插入特征工程,供后续的使用。您可以通过左侧大屏查看该特征工程的功能。当用户选择的是线下四种列。在特征工程中,完成特征工程的初始化操作才会产生初始值,用户可以对已有的特征列进行删除操作,进而生成新的特征列。单击JupyterLab环境编辑界面右上角的图标。在“特征操作流总览”区域会新增一个“特征处理”节点。特征操作支持删除 数据集 中指定的特征列,删除其余特征列。单击表头,选中需要执行的特征列。单击“特征操作”,从下拉框中选择“选择特征”。弹出“选择特征”对话框。检查“已选择特征”是否为用户选择的特征列。在“特征操作流总览”区域会新增一个“删除列”节点。待删除的特征列无误后,单击“确定”。从下拉框中选择“删除列”。在“特征操作流总览”区域会新增一个“选择特征”节点。卡方检验卡方检验卡方检验通过计算数据集的特征列和标签列之间的偏离程度(即卡方值)筛选出有价值的特征列。将卡方值由小到大排序,筛选出TOPN的特征列。为默认值为“离散”。特征操作流从下拉框中选择当前数据操作流的名字。操作流变量名如果存在多个数据操作流,可重命名操作流对象的变量名,以避免冲突。单击图标,运行“特征离散化”代码框内容。