检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用运维管理AOM是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。 AppStage运维中心支持将AOM产生的告警接入至监控服务中。 接入AOM告警操作步骤 添加标签。
操作名称 操作步骤 查看作业执行详情 在作业列表中,单击作业所在行“操作”列“执行详情”。 导出作业输出或日志 在作业列表中,单击已执行作业所在行“操作”列的“导出结果”,选择导出输出、日志或者全部,单击“确定”。 克隆已创建作业 在作业列表中,单击作业所在行“操作”列“更多 >
警。 指标 选择在指标仓库已创建的指标,创建指标请参见在运维中心指标仓库创建指标。 维度列表 来自于指标的逻辑实体上的维度,选择异常检测需要对哪些维度做检测。 ALL维度列表 选择需要过滤的维度。 维度过滤设置 只关注维度部分取值时,可以设置该参数对维度取值进行过滤。 指标类型 选择指标类型。
接入其他公有云数据 接入CES指标 接入CES告警 接入AOM告警 接入CES指标并生成业务报表 父主题: 监控资源和应用
资源的立体化监控平台与链路式的处理定位平台。在用户云上业务出现异常时,能够快速接收到异常并作出反应,为后续的定位、定界提供依据,保证业务顺畅运行。 前提条件 已配置主机监控指标采集,使用监控插件将数据接入运维中心,当数据异常时进行告警上报,具体操作请参见按主机绑定监控模板或按分组绑定监控模板。
您还可以对已创建的日志清理作业进行以下操作。 表2 相关操作 操作名称 操作步骤 停用日志清理作业 在日志清理作业列表中,单击日志清理作业所在行“启用”列的,当变为时,表示已停用该作业。 启用日志清理作业 在日志清理作业列表中,单击日志清理作业所在行“启用”列的,当变为时,表示已启用该作业。 查看执行历史
创建自动分发文件作业 监控服务支持配置文件分发作业,完成自动化文件分发。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已设置执行机。 创建文件分发作业 进入AppStage运维中心。
您还可以对已创建的定时作业进行以下操作。 表2 相关操作 操作名称 操作步骤 停用定时作业 在定时作业列表中,单击定时作业所在行“启用”列的,当变为时,表示已停用该作业。 启用定时作业 在定时作业列表中,单击定时作业所在行“启用”列的,当变为时,表示已启用该作业。 查看执行历史 在定时作业列表中
hickhouse表)是否存在异常。 修复异常后执行补数据操作。 选择指标仓库中的视图“Warehouse”作为异常检测数据,可在指标仓库异常检测视图详情页的“补数据”页签进行数据回补。 选择指标仓库中的指标“Indicator”作为异常检测数据,可在“AI辅助诊断 > 任务配置
使用JOB创建作业任务 创建业务工具并执行脚本 创建定时作业执行脚本 创建定时日志清理作业 创建自动分发文件作业 查看已创建作业清单 导出作业输出或作业日志 父主题: 监控资源和应用
汇聚数据至MPPDB表 数据汇聚是将MPPDB、 InfluxDB和ClickHouse数据源中的数据按需整合并进行分析处理。允许用户创建汇聚任务,以实现对采集指标的汇聚处理,从而使得数据能够在一个或多个MPPDB数据库中被统一管理、存储和分析。创建汇聚任务后,需要经过运维管理员或基础运维岗位人员的审
SLB一直同步,心跳异常 通过脚本排错 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务”。 选择左侧导航栏的“EAP&JOB > 脚本执行”,选择“公共工具”页签。 在名称栏中输入“slb”,单击“查询”。 在查询结果列表中,单击“slb_
scheduleCluster-ops:数据汇聚任务使用。 scheduleCluster-ops-ad:异常检测任务使用。 指标 选择指标仓库中已创建的指标,具体操作请参考在指标仓库创建指标。 维度列表 选择维度列,可多选。 Mppdb集群 选择Mppdb集群。 Mppdb数据库 选择Mppdb数据库。
完成令牌申请。 新增数据源 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“监控 > 报表开发”。 在业务报表编辑页面,单击左下角的“设置和帮助”,会显示“设置和帮助”菜单栏下的内容。
通过配置alert_by_chain参数可以控制是否加入突变检测。突变告警可以防止阈值线学习宽松条件下指标突变的漏告警,但对于不关注阈值线之上数据突变的指标会产生一些不必要的告警。 波动性告警 波动性告警只针对非请求量类指标,这类告警的特点是指标曲线没有触及阈值线,如图4所示。 图4 波动性告警 告警进入条件:局
参数说明 指标来源 选择告警的指标来源“AIOps”。 告警定义名称 自定义告警定义的名称。 级别 选择该规则生成告警的级别。 告警类型 选择告警类型,上报的告警会显示类型信息,可根据类型筛选查看告警。 指标 选择在指标仓库已创建的指标,创建指标请参见在运维中心指标仓库创建指标。 维度列表
初始化监控服务运维资源 初始化监控服务运维资源 对于已创建的产品及服务,首次进入使用监控服务,需要进行初始化。初始化会对Kafka、MPPDB、ClickHouse等的集群、数据库进行初始化。如图1所示,首次进入监控服务需要单击“开始初始化”,完成监控服务运维资源及数据的初始化,初始化后可以进入使用监控服务。
处理方式:包括立即通知、语音通知、转监控中心和不通知四种方式。 立即通知:会根据语音值班配置开启的通知方式,立刻触发通知流程,进行通知。 语音通知:语音值班配置开启了语音呼叫时,选择该方式语音呼叫会有三分钟左右的延迟,取决于告警上报的时间。短信和welink正常通知,不会延迟。 转监控中心:给AppStage运维中心的监控中心人员打电话。
应用运维 虚拟机日志接入 容器日志接入 主机监控接入 CES指标接入 指标开发 监控报表开发 告警配置 父主题: 一站式应用开发、应用托管以及应用运维
参数说明 指标来源 选择告警的指标来源“AIOps”。 告警定义名称 自定义告警定义的名称。 级别 选择该规则生成告警的级别。 告警类型 选择告警类型,上报的告警会显示类型信息,可根据类型筛选查看告警。 指标 选择在指标仓库已创建的指标,创建指标请参见在运维中心指标仓库创建指标。 维度列表