检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用运维管理-成长地图 | 华为云 应用运维管理 应用运维管理(简称AOM)是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。 了解服务
AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。 资源监控使用说明 告警管理 AOM支持通过告警规则对应用、资源
AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。 应用监控 工作负载监控 集群监控 主机监控 指标浏览 告警管理
载顺畅运行。 支持 支持 指标浏览 实时监控日志数据和各资源的指标数据及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看业务及分析数据关联分析。 部分支持 只支持监控分析指标数据,不支持监控分析日志数据。 支持 基础设施监控 实时监控主机和云服务运行状态和虚机CPU、内存、磁盘等信息。
优势 体验保障:实时掌控业务KPI健康状态,对异常事务根因分析。 故障快速诊断:分布式调用追踪,快速找到异常故障点。 资源运行保障:实时监控容器、磁盘、网络等上百种资源运维指标,集群->虚机->应用->容器异常关联分析。 图2 立体化运维
仪表盘监控 AOM仪表盘监控概述 创建AOM仪表盘 创建AOM仪表盘(新版) 设置AOM仪表盘全屏模式在线时长 设置AOM仪表盘过滤器 可观测大屏监控 统计图表说明 统计图表说明(新版)
一站式运维平台 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。 AOM有哪些优势
通过AOM监控云服务 云服务监控页面以曲线图、数字图等形式直观展示华为云各服务实例的运行状态、各个指标的使用情况等信息。当前支持在的云服务监控页面查看监控信息的云服务,包括:函数工作流 FunctionGraph、对象存储服务 OBS、弹性公网IP和带宽、弹性负载均衡 ELB、NAT网关
满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 告警规则分为阈值规则和事件类告警规则两种。通常情况下,通过阈值规则,实时监控环境中主机、组件等资源使用情况。当资源使用告警过多,告警通知过于频繁时,通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。
过配置分词可将日志内容按照分词符切分为多个单词,在日志搜索时可使用切分后的单词进行搜索。 指标浏览 指标浏览展示了各资源的指标数据,您可实时监控指标值及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看业务及分析数据关联分析。
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
告警降噪:在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 告警规则:通过创建告警或事件规则,实时监控资源使用情况。 查看告警或事件:提供告警和事件的查询和处理功能,便于您更快地发现、定位并恢复故障。 约束与限制 当前仅华南-广州区域的“
当前运维可观测大屏预置了基础版的业务指标监控大屏模板。业务指标监控大屏统一接入了业务告警、前端性能监控、集群以及云服务指标。通过对业务指标的实时监控,实现业务的实时观察。 约束与限制 如果需要在AOM控制台中使用AstroCanvas的功能,需要提前获取AstroCanvas的相关权
统计当前实例下流转流控失败数 ≥0 次 同时在线设备数 iotda_max_online_devices_totalCount 每天最大同时在线设备数 统计当前实例下每天最大同时在线设备数 ≥0 个 iotda_max_online_devices_percent 最大同时在线设备数百分比 统计当前实例下每天最大同时在线设备数百分比
服务进行监控。 应用性能管理服务 应用性能管理服务(Application Performance Management,简称APM)是实时监控并管理云应用性能和故障的云服务,提供专业的分布式应用性能分析能力,可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为您的体验保驾护航。
海二区域开放。 APM探针(Agent)目前产品规格包括免费版和企业版。当您从免费版切换到企业版后,计费方式默认为按需计费。APM探针支持在线购买企业版特惠包,通过特惠包可以获得一定程度的价格优惠。 功能介绍 表1 功能介绍 功能名称 说明 查看应用性能指标 应用概览页面展示应用
入(LTS)。 业务监控(基于日志) 支持创建日志指标规则,将上报到LTS的日志数据提取为指标来统一管理,便于后续在指标浏览、仪表盘界面实时监控。具体操作请参见:日志指标接入AOM。 父主题: 接入AOM(新版)
天的调用链数据来训练调用链模型。默认每14天后台自动更新模型,并将模型保存在后台数据库中。 在线推理阶段:当用户单击事件卡片,进入到根因分析页面时,会触发根因分析模型的在线推理任务,在线推理任务会基于上一步离线训练完的调用链模型与事件发生期间的异常调用进行模式对比,分析事件根因,进行快速定位。
选择待操作的仪表盘,在“仪表盘”页面右上角单击后的下拉箭头,开启仪表盘自动刷新开关。 轮播仪表盘 选择待操作的仪表盘,在“仪表盘”页面右上角单击。具体操作请参见设置全屏模式在线时长。 查询时间设置 选择待操作的仪表盘,在“仪表盘”页面右上角单击前面的下拉框,在下拉框可选择“近30分钟”、“近1小时”、“近6小时”
集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 创建全量指标告警规则:通过设置告警规则并关联分组规则,实时监控环境中主机、组件等资源使用情况。 前提条件 已创建告警行动规则。 步骤一:创建分组规则 创建一个分组规则,当产生AOM的紧急、重要告警时