检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“故障通报 > 通知组管理”,进入通知组管理页面。 单击“添加”。 填写通知组名称、备注,并在组内成员后的输入框输入成员账号名,并单击“单次添加”,可重复输入并添加多个成员。
创建定时作业定时执行脚本 监控服务支持配置定时作业,通过指定作业执行的时间、周期,分批次执行作业脚本。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已设置执行机。 创建定时作业 进入AppStage运维中心。 在顶部导航栏选择服务。
单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“告警 > 告警修复”。 单击“添加”,进入创建告警修复页面。 配置告警修复参数,参数说明如表1所示,配置完成后,单击“确定”。
单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 脚本执行”。 在 “业务工具”页面,单击待执行工具所在行“操作”列的“执行”。 配置执行参数。
单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 脚本执行 > 文件分发”。 (可选)作业名称为系统自动生成的名称,可去勾选“自动命名”后自定义作业名称。
单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“告警 > 告警列表”,进入告警列表页面。 在“显示模式”中选择“收敛告警”,如图2所示,然后单击“查询”,查看生成的收敛告警。
rm -rf aiops_filebeat rm -rf filebeat 父主题: 运维中心监控服务
ERROR: syntax error at or near too much null size judge_data_size(in):0 ERROR - fail to load canceling statement due to user request 父主题: 运维中心监控服务
父主题: 运维中心监控服务
单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > 预案 > 预案管理”。 单击“创建”。 输入预案名称及预案描述,单击“确定”。 步骤二:关联任务 在“预案管理”页面,单击已创建的预案所在行“操作”列的“任务”。
单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > 规则”。 单击“创建规则”。 配置规则参数,参数说明如表1所示,配置完成后,单击“确定”。
KeyError 问题现象 在judge日志中出现KeyError提示。 可能原因 KeyError后面的字段存在问题,字段不存在或者字段值为空。 解决方法 在MPPDB表管理中检索告警原始表,查看表字段名是否与告警指标字段一致。 在MPPDB汇聚中新建任务,查询对应指标字段数据是否为空
父主题: 运维中心监控服务
due to user request 问题现象 judge历史的原始详情中出现canceling statement due to user request错误提示,如下图: 可能原因 原始表数据量过大(超过500万),查询本次judge数据的SQL在10秒内没有执行完,后台mpp监控程序取消了本次查询
too much null size 问题现象 动态阈值告警任务,judge历史的原始详情中出现too much null size报错。 可能原因 告警原始表中存在大量空值或者表无数据。 解决方法 在MPPDB汇聚中新建任务,查询告警原始表中数据是否正常。 检查汇聚任务及上游数据处理环节
fail to load model json 问题现象 judge日志中显示trainModel is null或trainModel is {},并且提示fail to load model json,表示训练完成后judge未成功加载训练模型。 解决方法 依次单击“初始化Daemon
judge_data_size(in):0 问题现象 judge历史的原始详情中出现judge_data_size(in):0提示。 可能原因 judge没有获取到数据。 解决方法 检查告警原始表汇聚任务配置的汇聚提前时间和judge任务的汇聚提前时间,保证对应时间点能够获取到数据即可
ERROR - fail to load 问题现象 judge日志中出现ERROR - fail to load错误提示,如下图 可能原因 日志中提示加载模型失败,可能是因为容器在启动时加载模型失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge
步骤二:查看监控数据 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“监控 > 业务报表”,进入所在服务监控大盘页面。
TypeError: not supported between instances of 'str' and 'float' 问题现象 在judge日志中出现TypeError: not supported between instances of 'str' and 'float