检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
too much null size 问题现象 动态阈值告警任务,judge历史的原始详情中出现too much null size报错。 可能原因 告警原始表中存在大量空值或者表无数据。 解决方法 在MPPDB汇聚中新建任务,查询告警原始表中数据是否正常。 检查汇聚任务及上游数
开发并管理数据 创建数据表 导流数据至数据表 汇聚数据至MPPDB表 查看运维数据的数据血缘 父主题: 监控资源和应用
导流数据至数据表 监控服务已接入的数据,会保存在已创建或者系统自动创建的Kafka的Topic中,需要创建导流任务,将数据导流至ClickHouse或Influxdb数据表中。 将数据导流至ClickHouse/Influxdb表 进入AppStage运维中心。 在顶部导航栏选择服务。
已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建告警升级规则 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“告警 > 策略配置”。 单击“告警升级”,进入告警升级页面。 单击“创建”,进入创建告警升级规则页面。
创建运维事件并发送通知 监控服务支持对现网发生的可能造成或者已经造成服务中断、业务质量下降的系统告警等问题创建运维事件并发送通知。 创建运维事件并发送通知 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“故障通报
进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 脚本执行 > 作业清单”。 默认进入“虚拟机作业清单”页签查看虚拟机作业清单,也可以单击“容器作业清单”,进入“容器作业清单”页签查看容器作业清单。
ERROR - fail to load 问题现象 judge日志中出现ERROR - fail to load错误提示,如下图 可能原因 日志中提示加载模型失败,可能是因为容器在启动时加载模型失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启ju
已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 步骤一:创建日志项目 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“日志 > 日志接入”。 在“日志接入”页面,选择左侧导航栏的“日志项目”。 单击“创建日志项目”。
的计算公式。经过监控系统计算后,如果数据持续异常,则上报到告警系统中,产生告警。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建AIOps规则 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。
使用EAP进行流程管理 创建并执行EAP流程 创建WeLink触发规则 创建预案 为流程创建并关联标签 查看流程执行历史 查看已上架的EAP动作 父主题: 监控资源和应用
启动汇聚任务:审批通过的任务可以启动进行数据汇聚。 创建汇聚任务 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“运维数据开发 > 数据开发”,进入“数据开发”页面。 单击“数据汇聚”,根据实
接入其他公有云数据 接入CES指标 接入CES告警 接入AOM告警 接入CES指标并生成业务报表 父主题: 监控资源和应用
程,具体操作请参见创建并执行EAP流程。 创建告警修复规则 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“告警 > 告警修复”。 单击“添加”,进入创建告警修复页面。 配置告警修复参数
前提条件 已完成日志接入。 已完成创建导流任务。 操作步骤 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“日志 > 日志检索”。 在日志检索页面可以设置筛选条件,检索目标日志。 选择服
告警配置 AppStage运维中心支持对虚拟机监控数据或业务数据配置告警,及时掌握虚拟机状态,容器接入并安装监控插件后会自动生成告警。 配置虚拟机告警 配置虚拟机告警前需要先完成主机监控接入,并且已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 进入AppStage运维中心。
TypeError: not supported between instances of 'str' and 'float' 问题现象 在judge日志中出现TypeError: not supported between instances of 'str' and 'float'提示。
judge长时间处于SUBMIT状态直至失败 问题现象 judge记录一直处于提交未执行SUBMIT状态,直至失败FAIL。 可能原因 后端任务内存溢出,可以在训练日志中的ad-agent日志找到报错java.lang.OutOfMemoryError:Java heap space。
已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建通知组 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“故障通报 > 通知组管理”,进入通知组管理页面。 单击“添加”。 填写通知组名
judge日志无法查看,提示get request error 问题现象 查看judge日志任务时,出现get request error错误提示。 可能原因 judge日志持续日志打印,单个文件过大时,打开或者下载会提示失败。 解决方法 依次单击“初始化Daemon”、“注册任
PSQLException: ERROR: syntax error at or near 问题现象 judge历史的原始详情中出现PSQLException: ERROR: syntax error at or near报错。 可能原因 在judge日志的ad-agent日志中