检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在基础配置页面,默认显示新增任务时配置的信息,单击“字段配置”,切换至“字段配置”页签。 配置对应的参数,配置完成后,单击“确认”。 表5 基础数据参数说明 参数名称 参数说明 时间列 指定异常检测哪个列的数据是时间。 指标列 指定异常检测哪个列的数据是指标,即异常检测需要监控的指标。 计数列 指定异常检测哪个列的数据是请求量。
在监控服务快速配置异常检测任务 异常检测基于运维领域的数据的历史特征,对其未来的走向进行预测。一旦当前实际数据和预测值偏差到一定程度,则认为发生异常,会生成告警并上报至告警系统。 异常检测的能力是基于指标仓库、MPPDB数据库及异常检测服务所构建的。指标仓库定义了数据的来源和数据的计算方式。
创建异常检测任务 在监控服务快速配置异常检测任务 在监控服务新增异常检测任务 通过调整模型参数对异常告警调优 父主题: 使用监控服务进行资源及业务监控
动态阈值会通过训练历史数据,实现对数据特征的学习,构建数据的模型。并利用模型来预测数据的趋势走向。如图2黄色部分,实际值和预测值相差过大,认为异常。 图2 动态阈值 异常检测的能力是基于指标仓库,MPPDB数据库及异常检测服务所构建的。指标仓库定义了数据的来源和数据的计算方式。MPPDB数据库用来检测过程中的数据进
表4 日志采集配置参数说明 参数名称 参数说明 日志项目 选择已创建的日志项目,相同服务的不同日志使用同一个日志项目。 日志空间 选择已创建的日志空间。选择日志空间时日志提取规则会展示日志空间定义的日志格式,采集的日志须满足对应格式。 配置名称 自定义日志采集配置名称。 配置类型
表4 日志采集配置参数说明 参数名称 参数说明 日志项目 选择已创建的日志项目,相同服务的不同日志使用同一个日志项目。 日志空间 选择已创建的日志空间。选择日志空间时日志提取规则会展示日志空间定义的日志格式,采集的日志须满足对应格式。 配置名称 自定义日志采集配置名称。 配置类型
表4 日志采集配置参数说明 参数名称 参数说明 日志项目 选择已创建的日志项目,相同服务的不同日志使用同一个日志项目。 日志空间 选择已创建的日志空间。选择日志空间时日志提取规则会展示日志空间定义的日志格式,采集的日志须满足对应格式。 配置名称 自定义日志采集配置名称。 配置类型
异常检测Judge定时任务失败 KeyError TypeError: not supported between instances of 'str' and 'float' TypeError("Cannot index by location index with a non-integer
变量值较多时,产生的维度数超过了2000个。需要将该类型的接口归为一个维度,可以使用正则匹配, 在源头清洗数据,将这种URL类型接口清洗成一个维度。 维度数超过2000个,即如果用户有超过2000个接口的维度需要检测,建议在异常检测任务基础配置的“字段配置”中,在“获取动态值”页
"watchdog still running" 排查定位 登录SLB实例主机,并执行命令ps -ef | grep watchdog,查看watchdog进程是否是root用户拉起的。 解决方法 在SLB实例主机,执行命令kill -9 进程id关闭watchdog进程,然后重新部署。 父主题:
such file or directory......./ssl/dummy.pem" 解决方法 登录SLB实例主机,执行命令su os用户切换业务账号,然后执行以下命令: openssl req -new -newkey rsa:2048 -days 3650 -sha256 -nodes
在MPPDB汇聚中新建任务,查询对应指标字段数据是否为空。 确认汇聚任务及上游数据处理环节(数据接入至Kafka的Topic、数据导流至Chickhouse表)是否存在异常。 父主题: 异常检测Judge定时任务失败
修复异常后执行补数据操作。 选择指标仓库中的视图“Warehouse”作为异常检测数据,可在指标仓库异常检测视图详情页的“补数据”页签进行数据回补。 选择指标仓库中的指标“Indicator”作为异常检测数据,可在“AI辅助诊断 > 任务配置 > 异常检测 > 汇聚任务管理”页面进行数据回补。
json,表示训练完成后judge未成功加载训练模型。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge,观察执行结果。 父主题: 异常检测Judge定时任务失败
judge历史的原始详情中出现judge_data_size(in):0提示。 可能原因 judge没有获取到数据。 解决方法 检查告警原始表汇聚任务配置的汇聚提前时间和judge任务的汇聚提前时间,保证对应时间点能够获取到数据即可。 操作步骤 找到告警原始表对应的汇聚任务(MP
解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge,重新启动容器后观察是否恢复正常。 父主题: 异常检测Judge定时任务失败
user request 问题现象 judge历史的原始详情中出现canceling statement due to user request错误提示,如下图: 可能原因 原始表数据量过大(超过500万),查询本次judge数据的SQL在10秒内没有执行完,后台mpp监控程序取消了本次查询。
and 'float'提示。 解决方法 检查告警原始表指标字段的类型配置是否正确。 例如请求量指标错误配置为varchar类型,应该是数值类型,需要在MPPDB表管理中,将对应表字段类型调整正确。 父主题: 异常检测Judge定时任务失败
检查judge配置中“Dynamic Resource”按钮是否是打开状态,需要打开按钮。 在异常检测任务基础配置的“字段配置”页面,在维度的“维度值”中检查告警维度值是否存在特殊字符。 通过正则匹配和阈值限制降低维度值数量。 父主题: 异常检测Judge定时任务失败
载会提示失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge后会生成新的judge日志文件,再打开查看即可。 父主题: 异常检测Judge定时任务失败