检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
限申请操作请参见申请权限。 已创建流程。 步骤一:创建标签 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > 标签 > 标签管理”。 单击“创建”。 配置标签
已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 查看流程执行历史 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > 历史”,进入“历史”页面。 在列表中查看流程的执行历史。
已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建告警标记规则 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“告警 > 策略配置”。 单击“告警标记”,进入告警标记页面。 单击“添加”。
ctor-icon”的有效请求率已触发告警,详情请访问云监控服务”,输入“op_svc_Macro”可以匹配并过滤该告警。 查看已过滤告警 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“告警
已经上架了哪些动作,包含哪些能力。 查看已上架的EAP动作 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > EAP > 动作”,进入“动作”页面。 在列表中查看动作名称、类型、输入、输出,
已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建通知组 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“故障通报 > 通知组管理”,进入通知组管理页面。 单击“添加”。 填写通知组名
在异常检测任务告警配置页面,单击“保存”,出现dimensions value size over 2000错误提示,即异常检测任务配置的维度数超过2000个。 解决方法 维度为URL类型,如/xxx/{id}/aaa,接口中包含参数变量,当变量值较多时,产生的维度数超过了2000个。需要将该类型的接口归为一个维度,可以使用正则匹配,
限申请操作请参见申请权限。 已创建流程。 步骤一:创建预案 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > 预案 > 预案管理”。 单击“创建”。 输入预案名称及预案描述,单击“确定”。
删除告警任务失败 问题描述 删除告警任务失败,提示某个mppdb表不存在。 处理办法 将该mppdb表手动重建后,再尝试删除告警任务。 父主题: 运维中心监控服务
变更管理时出现如下报错: 处理办法 查看详细日志定位问题,操作步骤如下: 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 流程 > 流程列表”。 找到变更使用的EAP流程,进入流程详情页,单击上方。
如何卸载虚拟机上安装的filebeat? 使用运维中心监控服务配置虚拟机日志接入时,通过任务下发日志采集配置内容并安装filebeat。当用户不再使用运维中心或不再使用虚拟机时,可以手动卸载虚拟机上安装的filebeat。 前提条件 已获业务主机root账号密码。 操作步骤 使用root账号登录业务主机。
request错误提示,如下图: 可能原因 原始表数据量过大(超过500万),查询本次judge数据的SQL在10秒内没有执行完,后台mpp监控程序取消了本次查询。 解决方法 减少原始表数据量。 减少原始数据量,比如ttl可以减半。 如果是多个维度,可以拆成两个告警,原始表拆成多张表。 原始表的汇
judge没有获取到数据。 解决方法 检查告警原始表汇聚任务配置的汇聚提前时间和judge任务的汇聚提前时间,保证对应时间点能够获取到数据即可。 操作步骤 找到告警原始表对应的汇聚任务(MPPDB汇聚/ClickHouse汇聚/Influxdb汇聚/异常检测汇聚视图),查看其汇聚提前时间,一般设置为提前3分钟。
警结果表中没有该字段,所以会出现这种报错。 处理方法 可以在告警任务“基础”中增加一个空白维度,并手动添加一个空白维度值,保存后,再将空维度删除并保存,此时告警结果表会更新,并带有alert_type字段。 父主题: 运维中心监控服务
ERROR - fail to load canceling statement due to user request 父主题: 运维中心监控服务
配置虚拟机异常告警 AppStage支持定义服务的监控模板,然后通过为主机绑定监控模板,采集主机监控数据,并通过模板告警功能对虚拟机监控数据配置告警,及时掌握虚拟机状态。 限制条件 绑定监控模板进行虚拟机监控,支持的主机的操作系统版本包括EulerOS 2.X、HCE、CentO
KeyError 问题现象 在judge日志中出现KeyError提示。 可能原因 KeyError后面的字段存在问题,字段不存在或者字段值为空。 解决方法 在MPPDB表管理中检索告警原始表,查看表字段名是否与告警指标字段一致。 在MPPDB汇聚中新建任务,查询对应指标字段数据是否为空。 确
judge日志大小1KB,且不刷新日志内容 问题现象 judge日志大小1KB,且不刷新日志内容。 可能原因 告警原始表中存在字段值和字段类型不一致,导致解析失败。 解决方法 检查告警原始表中的数据是否有异常数据。 例如:数值类型的字段,值为NAN,可能是没有做除数为0的保护,修复异常,清理元数据,补数据后重新训练。
动态阈值告警任务,judge历史的原始详情中出现too much null size报错。 可能原因 告警原始表中存在大量空值或者表无数据。 解决方法 在MPPDB汇聚中新建任务,查询告警原始表中数据是否正常。 检查汇聚任务及上游数据处理环节(数据接入至Kafka的Topic、数据导流至Chickhouse表)是否存在异常。
null或trainModel is {},并且提示fail to load model json,表示训练完成后judge未成功加载训练模型。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge,观察执行结果。 父主题: 异常检测Judge定时任务失败