检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
保证机器与公网联通。 前提条件 已设置执行机。 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 步骤一:创建日志项目 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“日志
日志接入场景介绍 AppStage运维中心提供统一的AIOps平台能力,将业务日志数据从业务服务器接入到AIOps平台。AIOps日志服务平台提供了数据接入配置界面化管理和采集器Agent自动化部署的能力。 日志接入方式 虚拟机日志接入:通过日志配置下发任务部署filebeat,
您可以通过本操作设置条件进行日志查询。 前提条件 已完成日志接入。 已完成创建导流任务。 操作步骤 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“日志 > 日志检索”。 在日志检索页面可以设置筛选条件,检索目标日志。
在judge日志中出现KeyError提示。 可能原因 KeyError后面的字段存在问题,字段不存在或者字段值为空。 解决方法 在MPPDB表管理中检索告警原始表,查看表字段名是否与告警指标字段一致。 在MPPDB汇聚中新建任务,查询对应指标字段数据是否为空。 确认汇聚任务及上游数据
算子清洗功能介绍 功能说明 Filebeat是一个轻量级的采集器,用于采集和处理,转发日志数据。Filebeat将作为代理安装在您的服务器上,监控您指定的日志文件或位置,收集日志事件,并将它们转发到kafka,推送到下一个处理点。 processors是filebeat定义了一系列对单条日志操作的方法,目前支持三类操作:
管理主机 管理主机安全 管理主机运维账号 查看主机监控报表 启停主机 修改主机分配状态 重置主机OS 变更弹性云服务器主机规格 登录弹性云服务器主机 将弹性云服务器主机设置为执行机 升级弹性云服务器主机已安装的OpsAgent 将已归档的弹性云服务器主机恢复至可用状态 取消弹性云服务器主机纳管
图2 动态阈值 本章节介绍如何使用快速配置功能一步创建异常检测任务。 快速配置异常检测任务 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“AI辅助诊断 > 异常检测”,进入“异常检测”页面。
创建自动分发文件作业 监控服务支持配置文件分发作业,完成自动化文件分发。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已设置执行机。 创建文件分发作业 进入AppStage运维中心。 在顶部导航栏选择服务。
创建定时作业执行脚本 监控服务支持配置定时作业,通过指定作业执行的时间、周期,分批次执行作业脚本。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已设置执行机。 创建定时作业
AppStage运维中心监控服务支持采集CES收集的监控指标数据,并且可以快速创建指标及业务报表。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已购买并配置相应的华为云资源,如ECS、VPN、OBS等。 接入CES指标并生成业务报表 采集监控指标数据。
CES指标接入 云监控服务CES可以收集云服务内置监控指标的数据,可以通过监控这些指标来跟踪对应云服务状态。AppStage运维中心支持将CES收集的监控指标数据采集到运维中心监控服务中进行管理,可以参考支持监控的服务列表查看CES当前已支持的监控指标。 选择服务后首次使用监控服务,会初
目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 导出作业输出或日志 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“EAP&JOB > 脚本执行 > 作业清单”。 默
创建业务工具并执行脚本 监控服务支持创建业务工具用来定义相关业务脚本,例如机器的巡检、配置检查等,用户可以选择资源(虚拟机、容器或者虚拟机集群)来执行作业脚本。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
AppStage运维中心支持对虚拟机监控数据或业务数据配置告警,及时掌握虚拟机状态,容器接入并安装监控插件后会自动生成告警。 配置虚拟机告警 配置虚拟机告警前需要先完成主机监控接入,并且已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 进入AppStage运维中心。 在顶部导航栏选择服务。
支持多种辅助线,便于编辑页面时对页面报表布局。 步骤二:查看监控数据 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“监控 > 业务报表”,进入所在服务监控大盘页面。 在监控大盘中查看具体的监控数据,也可在左侧切换页面查看不同的报表数据。
request错误提示,如下图: 可能原因 原始表数据量过大(超过500万),查询本次judge数据的SQL在10秒内没有执行完,后台mpp监控程序取消了本次查询。 解决方法 减少原始表数据量。 减少原始数据量,比如ttl可以减半。 如果是多个维度,可以拆成两个告警,原始表拆成多张表。
选择指标仓库中的指标“Indicator”作为异常检测数据,可在“AI辅助诊断 > 任务配置 > 异常检测 > 汇聚任务管理”页面进行数据回补。 选择Mppdb表“Other”作为异常检测数据,可在“运维数据开发 > 数据开发 > 数据汇聚 > MPPDB汇聚”页面进行数据回补。 父主题: 异常检测Judge定时任务失败
可以在告警任务“基础”中增加一个空白维度,并手动添加一个空白维度值,保存后,再将空维度删除并保存,此时告警结果表会更新,并带有alert_type字段。 父主题: 运维中心监控服务
fail to load model json 问题现象 judge日志中显示trainModel is null或trainModel is {},并且提示fail to load model json,表示训练完成后judge未成功加载训练模型。 解决方法 依次单击“初始化D
judge_data_size(in):0 问题现象 judge历史的原始详情中出现judge_data_size(in):0提示。 可能原因 judge没有获取到数据。 解决方法 检查告警原始表汇聚任务配置的汇聚提前时间和judge任务的汇聚提前时间,保证对应时间点能够获取到数据即可。