网络智能体-数据探索:异常检测
异常检测
时序数据序列中存在模式不一致的异常点(如时序数据超出正常范围的上/下界,突然的上升或下降,趋势改变),时序数据的异常检测旨在快速准确地找到这些异常点。
- 在JupyterLab环境编辑区域,“选择数据”代码框下方单击“数据探索”。
- 选择“时序分析”页签。
- 在左侧目录树上单击“异常检测”。
- 设置“时间列”、“特征列”、“异常类型”等参数,具体参数说明如表5所示。
表5 参数说明 参数
参数说明
时间列
待异常检测时序数据的时间列。
特征列
待异常检测时序数据的特征列。
异常类型
异常检测类型:
异常区间获取方法
获取用于判断时序数据异常的上/下界区间的方法,支持:
- 箱线图
- 3 Sigma
- 两者任意一个检测到异常
- 两者同时检测到异常
突变点个数
“异常类型”为“突升/突降”时展示,表示需要检测到平稳时序数据中突增或突降点的个数。
默认值为5,检测结果有可能会小于这个个数。
是否进行周期分解
“异常类型”为“突升/突降”时展示,表示如果待检测数据为周期数据,是否需要进行周期分解,用于增强数据的差异性。
默认关闭。
一个周期内的数量值
“是否进行周期分解”开启时展示此参数,表示进行周期分解时,一个周期内的数据量。
是否进行过滤
“异常类型”为“突升/突降”时展示,表示是否对检测出的Top N个点进行二次过滤。
默认关闭。
过滤阀值
“是否进行过滤”开启时展示,表示如果对检测出的Top N个点进行二次过滤,则该参数作为过滤阈值,小于阈值的点将被认为是突变点。
提交分析请求。
提交分析任务至分析完成期间,可单击此按钮终止分析任务。
- 单击“分析”。
分析完成后右侧展示分析结果图,可单击“保存至特征工程”将分析结果图保存到JupyterLab环境编辑区域。