检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用洞察(日落) 应用洞察提供应用监控、应用资源管理以及日志接入的功能。通过应用监控您可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行;应用资源管理能将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据
GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分内容。当资源不存在的时候,PATCH可能会去创建一个新的资源。
在“组件列表”页签下,可查看该应用的组件运行状态、资源使用情况等信息。 在“主机列表”页签下,可查看该应用的主机运行状态、资源使用情况等信息。 在“监控视图”页签下,选择对应的Prometheus实例,可查看该应用的资源使用情况。单击页面右上角的,可全屏展示资源信息。 在“告警”页签下,可查看该应用的告警详情,详情请参见查看告警。
Management,简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。 AOM有哪些优势 图3 AOM优势1 图4 AOM优势2 海量日志管理
告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。 告警源:触发告警或事件的服务名称。可以设置为AOM
应用运维管理(简称AOM)是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。 了解服务 立即使用 成长地图 由浅入深,带您玩转AOM 01
告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。 告警源:触发告警或事件的服务名称。可以设置为AOM
告警。 资源类型 支持选择资源类型别进行搜索。 资源类型:Host,即可查询出指定时间范围内资源类型为“Host”的告警。 告警源 支持选择告警源进行搜索。 告警源:AOM,即可查询出指定时间范围内告警源为“AOM”的告警。 告警关键字 支持按告警名称 、 告警源、资源类型等告警关键字进行模糊查询。
2022-04-16 告警降噪功能优化。 2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 2021-10-20 支
AOM 2.0控制台入口 LTS控制台入口 参考文档链接 日志管理 日志管理界面作为日志功能的概览页面,主要包含以下功能: 日志管理 提供资源统计、日志应用、我的收藏/我的收藏(本地缓存)、最近访问、告警统计、最新告警、功能上线公告和FAQ等信息。 日志搜索与分析 当需要通过日志
metheus实例接口。 应用资源管理:包括所有应用资源相关接口对应的授权项,例如新增应用接口。 自动化运维:包括所有自动化运维相关接口对应的授权项,例如创建任务接口。 告警 监控 Prometheus监控 Prometheus实例 日志 应用资源管理 自动化运维 父主题: 权限策略和授权项
应用洞察(日落) 应用监控 应用资源管理 日志接入
API 告警 监控 prometheus监控 日志 Prometheus实例 配置管理 UniAgent管理 应用资源管理(aom2.0接口) 自动化运维(aom2.0接口)
取值范围:0s-10min,推荐设置为 15s。 变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。通常设置为分钟级别的时间。如果您需要尽快收到告警通知,也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。 取值范围:5s-30min,推荐设置为60s。 重复等待
覆盖用户端、服务端及云产品所有监控数据,提供从数据发现、数据展示到数据异常告警的全方位、可视化监控服务,实现从上到下、从前端到后端的全栈一体化监控。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。 精准告警 构建指标告警、事件告警、日志告警
TopN:统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,默认展示占用最高的前五个资源。 当资源数量很多时,您想快速了解资源占用最高的资源,可在仪表盘中添加TopN图表,您只需要选择资源类型和指标,例如主机的CPU
Read方式读取Prometheus实例数据 自建Prometheus数据上报到AOM 通过Grafana查看Prometheus实例数据 统计资源消耗
支持导出近48个小时原始数据。 支持仪表盘、API导出。 支持数据写入kafka。 聚合查询 不支持聚合查询,仅支持简单查询。 支持多实例聚合查询,例如:按标签、按资源组等聚合。 PromQL语法 不支持 支持,告警规则、仪表盘、指标浏览等监控功能均支持。 仪表盘 支持标准云产品的单实例大盘。 提供丰富的预置模板。
创建告警规则时选择告警或事件级别:紧急、重要、次要、提示。 ${event_severity} 告警内容 详细的告警信息说明。 ${alarm_info} 资源标识 触发告警或事件对应的具体资源。 ${resources} 自定义标签 标签扩展字段。 $event.metadata.key1 修复建议 修复建议,非自定义上报则展示"NA"。
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust