网络智能体-特征工程:使用特征工程服务对剩余的三份数据做特征处理
使用特征工程服务对剩余的三份数据做特征处理
四份数据的特征处理操作完全相同,可以将前面的特征处理工程,发布成特征工程服务,再通过创建任务的方式,分别生成经过特征处理的数据集。
下述操作以故障硬盘训练集的操作为例,进行操作说明。
- 在JupyterLab环境编辑界面,单击“Harddisk.ipynb”页签下方的
图标,保存算法主文件的所有操作。
在将特征工程发布成服务前,请先保存算法主文件,否则会导致特征工程服务异常,无法正常调用。
- 在JupyterLab环境编辑界面,单击界面右上角的
图标,弹出如图5所示的对话框。
参数“ServiceName”为特征工程发布服务名,请根据实际情况设置。示例:harddisk。
- 单击“Publish”,将特征工程发布成服务。
发布成功后,会弹出成功提示框,单击“OK”。
- 在菜单栏中,单击“特征工程”,进入“特征工程管理”界面。
- 单击“已发布服务”页签,查看特征工程服务,如图6所示。
- 单击特征工程服务行对应“操作”列的
图标。
弹出“创建任务”对话框。参数配置说明,如下所示,其余参数保持默认值即可。
- 任务名称:特征工程服务任务名称。示例:Train_Fail。
- 数据集:从下拉框中选择预置数据集“HardDisk-Detect(HardDisk)”。
- 数据实例 :从下拉框中选择故障硬盘训练数据集“HardDisk-Detect_Train_Fail”。
- 目标数据集:从下拉框中选择预置数据集“HardDisk-Detect(HardDisk)”。
- 目标数据实例:经过特征工程任务处理后,生成的数据集名称。示例:Train_fail_FE。
- AI引擎:AI算法运行平台,从下拉框中选择“TF-1.8.0-python3.6”。
- 规格:资源配置信息,从下拉框中选择“2核|8G”。
- 单击“创建”,进入特征工程任务详情界面。
当任务的“任务状态”列为“FINISHED”时,说明故障硬盘训练集的特征处理操作完成。
- 请参考6~7,依次对无故障硬盘测试和故障硬盘测试数据集做特征工程处理。
等待所有特征工程任务处理完成。
- 单击菜单栏中的“数据集”,进入数据集页面。
查看经过特征处理,生成的四份新数据,如图7所示。通过特征工程任务,生成的新数据的“数据来源”均为“JOB”。