检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
可以在告警任务“基础”中增加一个空白维度,并手动添加一个空白维度值,保存后,再将空维度删除并保存,此时告警结果表会更新,并带有alert_type字段。 父主题: 运维中心监控服务
too much null size 问题现象 动态阈值告警任务,judge历史的原始详情中出现too much null size报错。 可能原因 告警原始表中存在大量空值或者表无数据。 解决方法 在MPPDB汇聚中新建任务,查询告警原始表中数据是否正常。 检查汇聚任务及上游数
fail to load model json 问题现象 judge日志中显示trainModel is null或trainModel is {},并且提示fail to load model json,表示训练完成后judge未成功加载训练模型。 解决方法 依次单击“初始化D
judge_data_size(in):0 问题现象 judge历史的原始详情中出现judge_data_size(in):0提示。 可能原因 judge没有获取到数据。 解决方法 检查告警原始表汇聚任务配置的汇聚提前时间和judge任务的汇聚提前时间,保证对应时间点能够获取到数据即可。
将弹性云服务器主机设置为执行机 已纳管的Linux主机可以设置为执行机,执行机将在部署服务虚拟机部署、监控服务日志接入/脚本执行、演练服务执行快速演练任务、负载均衡创建实例、数据库治理纳管实例和数据查询时使用。 前提条件 已获取基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
ERROR - fail to load 问题现象 judge日志中出现ERROR - fail to load错误提示,如下图 可能原因 日志中提示加载模型失败,可能是因为容器在启动时加载模型失败。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启ju
在VMS变更弹性云服务器主机规格 在VMS页面可以直接变更已纳管的弹性云服务器主机的规格。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 变更主机规格 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 主机管理服务(VMS)”。
TypeError: not supported between instances of 'str' and 'float' 问题现象 在judge日志中出现TypeError: not supported between instances of 'str' and 'float'提示。
judge长时间处于SUBMIT状态直至失败 问题现象 judge记录一直处于提交未执行SUBMIT状态,直至失败FAIL。 可能原因 后端任务内存溢出,可以在训练日志中的ad-agent日志找到报错java.lang.OutOfMemoryError:Java heap space。
告警配置 AppStage运维中心支持对虚拟机监控数据或业务数据配置告警,及时掌握虚拟机状态,容器接入并安装监控插件后会自动生成告警。 配置虚拟机告警 配置虚拟机告警前需要先完成主机监控接入,并且已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 进入AppStage运维中心。
升级弹性云服务器主机已安装的OpsAgent 可以在“弹性云服务器”页面升级主机已安装的OpsAgent。 前提条件 已获取基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 升级OpsAgent 进入AppStage运维中心。 单击,选择“运维 > 主机管理服务(VMS)”。
支持多种辅助线,便于编辑页面时对页面报表布局。 步骤二:查看监控数据 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“监控 > 业务报表”,进入所在服务监控大盘页面。 在监控大盘中查看具体的监控数据,也可在左侧切换页面查看不同的报表数据。
在异常检测任务基础配置的“字段配置”页面,在维度的“列名”新增一个空维度,并打开编辑器,手动增加一个空的维度值,保存后再去掉空维度,重新动态获取维度后保存,系统会自动创建新的告警结果表,然后重新训练即可。 操作步骤 在异常检测任务基础配置的“字段配置”页面,单击维度“列名”后的加号,新增空维度。
judge日志无法查看,提示get request error 问题现象 查看judge日志任务时,出现get request error错误提示。 可能原因 judge日志持续日志打印,单个文件过大时,打开或者下载会提示失败。 解决方法 依次单击“初始化Daemon”、“注册任
PSQLException: ERROR: syntax error at or near 问题现象 judge历史的原始详情中出现PSQLException: ERROR: syntax error at or near报错。 可能原因 在judge日志的ad-agent日志中
judge日志大小1KB,且不刷新日志内容 问题现象 judge日志大小1KB,且不刷新日志内容。 可能原因 告警原始表中存在字段值和字段类型不一致,导致解析失败。 解决方法 检查告警原始表中的数据是否有异常数据。 例如:数值类型的字段,值为NAN,可能是没有做除数为0的保护,修复异常,清理元数据,补数据后重新训练。
间和业务中断,减轻可能出现的业务损失和客户流失。 提供实时监控和报告:AppStage运维中心集成了丰富的监控和报表功能,可以实时监控系统的性能指标、资源利用率和安全状态等。通过可视化的报表和图表,SRE可以随时了解系统的运行情况,进行及时的决策和调整。同时,这些信息也可以用于向上级管理层的汇报和运维成果展示。
将已归档的弹性云服务器主机恢复至可用状态 弹性云服务器主机长时间不使用会进入到归档状态,归档状态即一种暂时回收的状态。恢复主机状态可以将已归档主机恢复到可用状态。 前提条件 已获取基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 恢复主机状态 进入AppStage运维中心。
虚拟机日志接入 本章节介绍如何通过filebeat采集虚拟机日志。 监控服务安装filebeat是使用子用户sudo权限进行安装,SUSE15系统没有自带sudo命令。如果需要采集的虚拟机操作系统为SUSE15,需要使用root用户登录主机,并执行zypper install s
虚拟机日志接入 本章节介绍如何通过filebeat采集虚拟机日志。 监控服务安装filebeat是使用子用户sudo权限进行安装,SUSE15系统没有自带sudo命令。如果需要采集的虚拟机操作系统为SUSE15,需要使用root用户登录主机,并执行zypper install s