检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基础数据参数说明 参数名称 参数说明 时间列 指定异常检测哪个列的数据是时间。 指标列 指定异常检测哪个列的数据是指标,即异常检测需要监控的指标。 计数列 指定异常检测哪个列的数据是请求量。 补充列 可以选择补充异常检测数据列。 维度 指定对哪些维度进行检测。 列名:指定维度列名,如需新增维度,可单击“+”号。
的计算方式。MPPDB数据库用来检测过程中的数据进行存储。而异常检测服务提供了异常检测的计算调度及告警能力。所以异常检测的前提条件是配置了相关指标,并分配了MPPDB及异常检测集群(初始化监控服务会自动分配集群)。 异常检测算法分为两种,固定阈值算法和动态阈值算法。 固定阈值算法
创建异常检测任务 在监控服务快速配置异常检测任务 在监控服务新增异常检测任务 通过调整模型参数对异常告警调优 父主题: 使用监控服务进行资源及业务监控
选择左侧导航栏的“AI辅助诊断 > 异常检测”,进入“异常检测”页面。 单击已修改告警的任务所在行“操作”列的“模型”。 单击“judge配置”,在judge配置页面单击“初始化Daemon”重启judge Daemon,调优的参数立即生效。 父主题: 创建异常检测任务
为异常。 图2 动态阈值 异常检测的能力是基于指标仓库,MPPDB数据库及异常检测服务所构建的。指标仓库定义了数据的来源和数据的计算方式。MPPDB数据库用来检测过程中的数据进行存储。而异常检测服务提供了异常检测的计算调度及告警能力。所以,异常检测的前提条件是配置了相关指标,并分配了MPPDB及异常检测集群。
异常检测Judge定时任务失败 KeyError TypeError: not supported between instances of 'str' and 'float' TypeError("Cannot index by location index with a non-integer
”作为异常检测数据,可在指标仓库异常检测视图详情页的“补数据”页签进行数据回补。 选择指标仓库中的指标“Indicator”作为异常检测数据,可在“AI辅助诊断 > 任务配置 > 异常检测 > 汇聚任务管理”页面进行数据回补。 选择Mppdb表“Other”作为异常检测数据,可在“运维数据开发
为空。 确认汇聚任务及上游数据处理环节(数据接入至Kafka的Topic、数据导流至Chickhouse表)是否存在异常。 父主题: 异常检测Judge定时任务失败
解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge,重新启动容器后观察是否恢复正常。 父主题: 异常检测Judge定时任务失败
/异常检测汇聚视图),查看其汇聚提前时间,一般设置为提前3分钟。 查看judge任务汇聚提前时间,一般设置为提前5分钟。 可以适当增加judge任务汇聚提前时间,确保judge能够获取到数据即可。 如果上游任务时延较大,需要联系技术支持工程师协助处理。 父主题: 异常检测Judge定时任务失败
检查judge配置中“Dynamic Resource”按钮是否是打开状态,需要打开按钮。 在异常检测任务基础配置的“字段配置”页面,在维度的“维度值”中检查告警维度值是否存在特殊字符。 通过正则匹配和阈值限制降低维度值数量。 父主题: 异常检测Judge定时任务失败
检查告警原始表指标字段的类型配置是否正确。 例如请求量指标错误配置为varchar类型,应该是数值类型,需要在MPPDB表管理中,将对应表字段类型调整正确。 父主题: 异常检测Judge定时任务失败
json,表示训练完成后judge未成功加载训练模型。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge,观察执行结果。 父主题: 异常检测Judge定时任务失败
如果是多个维度,可以拆成两个告警,原始表拆成多张表。 原始表的汇聚周期可以调大,比如原来是1分钟粒度汇聚,可以改为5分钟。 父主题: 异常检测Judge定时任务失败
0,说明维度值为空。 解决方法 在异常检测任务基础配置的“字段配置”页面,查看获取到的维度值是否为空。 在MPPDB汇聚中新增任务,查询告警原始表数据是否正常。 查看上游任务(数据接入至Kafka的Topic、数据导流至Chickhouse表)是否正常。 父主题: 异常检测Judge定时任务失败
location index with a non-integer key")提示。 解决方法 在异常检测任务基础配置的“字段配置”中,将维度的“列名”修改为对应的维度字段。 父主题: 异常检测Judge定时任务失败
单击维度“列名”后的减号,删掉新增的空维度,单击“确认”。 在异常检测任务模型配置的“算法配置”页面,查看“输出表名”改为新的系统自动创建的输出表。 在异常检测任务模型配置的“训练配置”页面,单击“立即训练”。 父主题: 异常检测Judge定时任务失败
依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge后会生成新的judge日志文件,再打开查看即可。 父主题: 异常检测Judge定时任务失败
> 异常检测 > 汇聚任务管理”中对相应的告警原始表汇聚任务依次单击“元数据清理”、“补数据”,进行数据回补。 使用Warehouse,即指标仓库中的视图作为异常检测数据创建的告警,需要在异常检测视图详情页的“补数据”页签进行数据回补。 告警任务重新训练。 父主题: 异常检测Judge定时任务失败
监控服务 监控服务(ServiceInsight)是一个面向自有服务和生态开发者的开发或运维SRE,围绕故障生命周期,构建开箱即用的,集预防、检测、诊断、恢复、通报和改进于一体的可观测性平台。 运行时引擎 微服务平台(NUWA) 微服务平台(NUWA Runtime,简称NUWA)托