检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用指标摸板库生成指标运行失败 问题描述 应用指标摸板库生成指标时,提示运行失败。 处理方法 检查选择的数据源和应用的模型是否匹配。模型对选择的数据是有要求的,数据源和模型之间不匹配,将导致指标运行失败。 父主题: 运营中心
null或trainModel is {},并且提示fail to load model json,表示训练完成后judge未成功加载训练模型。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge,观察执行结果。 父主题: 异常检测Judge定时任务失败
申请权限。 创建扩容模板 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 部署服务”。 选择左侧导航栏的“虚拟机集群 > 扩容模板”。 单击“创建”,进入创建扩容模板页面。 配置扩容模板参数,参数说明如表1所示,配置完成后,单击“确定”。 表1 创建扩容模板参数说明
排查定位 登录SLB实例主机,并执行命令ps -ef | grep watchdog,查看watchdog进程是否是root用户拉起的。 解决方法 在SLB实例主机,执行命令kill -9 进程id关闭watchdog进程,然后重新部署。 父主题: SLB部署失败相关问题
SLB部署失败,日志详细信息提示如下: [Errno 13] Permission denied: '/opt/huawei/release/lf_test/SLB/' 解决方法 登录SLB实例机器,执行命令chown slb:slb /opt/huawei/release修改用户与属组。 父主题: SLB部署失败相关问题
查看judge日志任务时,出现get request error错误提示。 可能原因 judge日志持续日志打印,单个文件过大时,打开或者下载会提示失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge后会生成新的judge日志文件,再打开查看即可。 父主题: 异常检测Judge定时任务失败
在judge日志中出现TypeError("Cannot index by location index with a non-integer key")提示。 解决方法 在异常检测任务基础配置的“字段配置”中,将维度的“列名”修改为对应的维度字段。 父主题: 异常检测Judge定时任务失败
在judge日志中出现TypeError: not supported between instances of 'str' and 'float'提示。 解决方法 检查告警原始表指标字段的类型配置是否正确。 例如请求量指标错误配置为varchar类型,应该是数值类型,需要在MPPDB表管理中,将对应表字段类型调整正确。
judge日志中出现ERROR - fail to load错误提示,如下图 可能原因 日志中提示加载模型失败,可能是因为容器在启动时加载模型失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge,重新启动容器后观察是否恢复正常。 父主题: 异常检测Judge定时任务失败
/opt/huawei/openresty/nginx/conf/" 原因分析 conf目录下某些文件的属主不是业务用户,属主需修改成业务用户。 解决方法 登录SLB实例主机,执行命令chown slb:slb /opt/huawei/openresty/nginx/conf修改用户与属组。
配置同步失败,日志详细信息提示如下: "no such file or directory......./ssl/dummy.pem" 解决方法 登录SLB实例主机,执行命令su os用户切换业务账号,然后执行以下命令: openssl req -new -newkey rsa:2048
没有SQL脚本 问题现象 任务创建成功,但是没有sql脚本执行。 处理方法 请自行确认组合包中是否存在除了版本名一样其他字段都一模一样的SQL包,打包禁止出现这种场景,否则获取将包文件信息失败。 或是运维中心存在重复推包的情况,导致存在重复,系统会随机选择一个包执行,可能是执行一个异常的包,没有脚本就是空包。
/etc/rc.d/init.d/functions: No such file or directory 原因分析 部署包选择错误。 解决方法 登录SLB实例主机,执行命令cat /proc/version,查看环境系统,如图1所示。 SLB分为ARM、X86两个版本,界面上部署时需要选择与环境系统一样的包。
有写的权限,那么部署完之后,slb_agent的域名映射就会下发失败,导致业务部署完,无法在界面上对SLB机器执行同步、重启等操作。 解决方法 登录SLB实例主机,执行命令chmod 666 /etc/hosts,给/etc/hosts加上写的权限,默认是444,建议给666。 父主题:
KeyError 问题现象 在judge日志中出现KeyError提示。 可能原因 KeyError后面的字段存在问题,字段不存在或者字段值为空。 解决方法 在MPPDB表管理中检索告警原始表,查看表字段名是否与告警指标字段一致。 在MPPDB汇聚中新建任务,查询对应指标字段数据是否为空。 确
在judge日志的ad-agent日志中查看到报错maxDimensionValueCount should not be 0,说明维度值为空。 解决方法 在异常检测任务基础配置的“字段配置”页面,查看获取到的维度值是否为空。 在MPPDB汇聚中新增任务,查询告警原始表数据是否正常。 查看上
在微服务平台查看微服务部署日志 通过微服务平台查看微服务部署日志。 查看微服务部署日志 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 微服务平台”。 选择左侧导航栏的“微服务管理”。 选择微服务列表操作列的“更多 > 部署日志”,查看微服务部署日志。
request错误提示,如下图: 可能原因 原始表数据量过大(超过500万),查询本次judge数据的SQL在10秒内没有执行完,后台mpp监控程序取消了本次查询。 解决方法 减少原始表数据量。 减少原始数据量,比如ttl可以减半。 如果是多个维度,可以拆成两个告警,原始表拆成多张表。 原始表的汇聚周期可以调大
lang.OutOfMemoryError:Java heap space。 维度数据问题,存在特殊字符,或者数据量和维度值数量较大。 解决方法 检查judge配置中“Dynamic Resource”按钮是否是打开状态,需要打开按钮。 在异常检测任务基础配置的“字段配置”页面,在
memory) nginx: [alert] munmap(FFFFFFFFFFFFFFFF, 524288000) failed" 解决方法 使用的机器最低规格为2C8G。 登录SLB实例主机,执行命令/opt/huawei/openresty/init.d/nginx restart,重启Nginx再同步。