网络智能体-特征工程:使用特征工程服务对剩余的三份数据做特征处理

时间:2025-01-26 10:33:35

使用特征工程服务对剩余的三份数据做特征处理

四份数据的特征处理操作完全相同,可以将前面的特征处理工程,发布成特征工程服务,再通过创建任务的方式,分别生成经过特征处理的数据集。

下述操作以故障硬盘训练集的操作为例,进行操作说明。

  1. 在JupyterLab环境编辑界面,单击“Harddisk.ipynb”页签下方的图标,保存算法主文件的所有操作。

    在将特征工程发布成服务前,请先保存算法主文件,否则会导致特征工程服务异常,无法正常调用。

  2. 在JupyterLab环境编辑界面,单击界面右上角的图标,弹出如图5所示的对话框。

    参数“ServiceName”为特征工程发布服务名,请根据实际情况设置。示例:harddisk。

    图5 特征工程服务

  3. 单击“Publish”,将特征工程发布成服务。

    发布成功后,会弹出成功提示框,单击“OK”。

  4. 在菜单栏中,单击“特征工程”,进入“特征工程管理”界面。
  5. 单击“已发布服务”页签,查看特征工程服务,如图6所示。

    图6 特征工程服务

  6. 单击特征工程服务行对应“操作”列的图标。

    弹出“创建任务”对话框。参数配置说明,如下所示,其余参数保持默认值即可。

    • 任务名称:特征工程服务任务名称。示例:Train_Fail。
    • 数据集:从下拉框中选择预置数据集“HardDisk-Detect(HardDisk)”。
    • 数据实例 :从下拉框中选择故障硬盘训练数据集“HardDisk-Detect_Train_Fail”。
    • 目标数据集:从下拉框中选择预置数据集“HardDisk-Detect(HardDisk)”。
    • 目标数据实例:经过特征工程任务处理后,生成的数据集名称。示例:Train_fail_FE。
    • AI引擎:AI算法运行平台,从下拉框中选择“TF-1.8.0-python3.6”。
    • 规格:资源配置信息,从下拉框中选择“2核|8G”。

  7. 单击“创建”,进入特征工程任务详情界面。

    当任务的“任务状态”列为“FINISHED”时,说明故障硬盘训练集的特征处理操作完成。

  8. 请参考6~7,依次对无故障硬盘测试和故障硬盘测试数据集做特征工程处理。

    等待所有特征工程任务处理完成。

  9. 单击菜单栏中的“数据集”,进入数据集页面。

    查看经过特征处理,生成的四份新数据,如图7所示。通过特征工程任务,生成的新数据的“数据来源”均为“JOB”。

    图7 数据集页面

support.huaweicloud.com/usermanual-naie-model-training/naie_model_training_02_0008.html