应用平台 APPSTAGE-通过调整模型参数对异常告警调优:调优配置方法

时间:2025-01-03 11:38:52

调优配置方法

在“异常检测”页面,单击异常检测任务所在行“操作”列的“模型”,默认显示“算法配置”页签,参考表1配置参数。
表1 算法配置参数说明

算法类型

参数名称

参数含义

取值范围

参数说明

配置建议

boxplot_ad动态阈值算法

sensitivity

敏感度

0-10

默认值5

敏感度参数越高,阈值线越紧;敏感度参数越低,阈值线越松。

敏感度参数最高不超过5.5,最低不低于3.5;一般配置4.5或者5。

  • 请求量指标因为使用了新的算法,敏感度可以在0.5—5之间调节。
  • 时延、请求量、速率类指标敏感度每降低0.5,阈值线相对浮动3%,绝对浮动3。
  • 成功率、失败率指标敏感度每降低0.5,阈值线相对浮动0.3%,绝对浮动0.3%。

low_count_threshold

小请求量

0- 100000000

默认值0

请求量低于此参数值时毛刺告警、波动性不生效;其他类型的告警依然生效。

如果毛刺告警较多,可以配置该参数。

count_threshold

请求量保护

0-100000000

默认值100000000

请求量低于此参数值时,完全不告警。

一般情况下不建议配置,请谨慎配置,且对请求量类指标不生效。

no_model_threshold_upper

无模型阈值上限

0-100000000

默认值100000000

无模型时配置的阈值上限(固定阈值线)。

对于新增的接口,因为没有历史数据,无法训练出该接口的模型,此时可以配置合适的值用来监控此类接口。

no_model_threshold_lower

无模型阈值下限

0-100000000

默认值0

无模型时配置的阈值下限(固定阈值线)。

对于新增的接口,因为没有历史数据,无法训练出该接口的模型,此时可以配置合适的值用来监控此类接口。

alert_by_std

波动性告警

True/False

默认为True

非请求量类指标参数,通过该参数设置是否引入波动性告警。

-

alert_by_chain

突变告警

True/False

默认为True

请求量类指标参数,通过该参数设置是否引入突变告警。

-

alert_by_drop_to_0

长时间掉0告警

True/False

默认为True

请求量类指标参数,通过该参数设置是否引入长时间掉0告警。

-

alert_by_spikes

毛刺告警

True/False

默认为True

所有指标参数,通过该参数设置是否引入毛刺告警。

-

small_sample_threshold

brand算法阈值

0-1000000

默认值100

brand算法阈值,小于该阈值, 则使用brand算法,否则使用boxplot算法。

-

fixed_threshold固定阈值算法

filled_value

补充值

0-100000000

默认值1

缺值时补值,补值不会产生告警,只用于前端展示。(必填值,与指标类型同等重要)

成功率指标填1;失败率填0;时延填合适的值(比上阈值线小即可);速率填合适的值(比下阈值线大即可);请求量类型保持默认值即可。

threshold_upper

阈值上限

0-100000000

默认值100000000

配置的固定阈值上限。

-

threshold_lower

阈值下限

0-100000000

默认值100000000

配置的固定阈值下限。

-

annomaly_in_mins

告警进入时间

0-30

默认10分钟

告警进入时间,单位分钟。

-

annomaly_out_mins

告警退出时间

0-30

默认10分钟

告警退出时间,单位分钟。

-

count_threshold

请求量保护参数

0-100000000

默认值0

请求量保护参数,低于这个值不告警;对请求量类型指标不生效。

-

support.huaweicloud.com/usermanual-wiseeye/appstage_04_2119.html