检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。 约束与限制 配置的日志接入LTS规则可能会影响LTS中的日志数据,产生额外的费用,请谨慎操作。 配置接入规则
应用运维管理-成长地图 | 华为云 应用运维管理 应用运维管理(简称AOM)是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。 了解服务
U、物理内存、文件系统等信息。 在“相关资源”页签下,可按节点和节点名称、工作负载和负载名称、容器和容器名称查看当前容器组下的节点、工作负载、容器。 在左侧导航栏选择“洞察 > 容器 ”,可查看该集群的所有容器状态和资源使用情况。 在容器列表上方,可按容器名称设置过滤条件,实现容器过滤显示。
HttpClient错误率由高到低排序,前10位的组件环境。 在“应用”和“区域”下拉框中选择需要监控的应用和区域,即可查看不同应用和区域的概览指标数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的指标数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警
指标告警规则 通过指标告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 应用性能监控告警规则 通过创建应用性
创建AOM事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 约束与限制 当服务的资源数据满足事件条件时,如需使用企业微信、钉钉、飞书、语音、welink、邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。
变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。通常设置为分钟级别的时间。如果您需要尽快收到告警通知,也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。 取值范围:5s-30min,推荐设置为60s。 重复等待 合并集合内的告警数据重复后,等待多久发送告警通知。通常设置为小时级别的时间。
搜索日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志搜索”。 使用日志分析(新版)功能的区域可以通过表2中描述的入口进入“日志路径”页面。
采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。 AK/SK 访
)、函数工作流(FunctionGraph)、云数据库 GaussDB、图引擎服务(GES)、云数据库 GaussDB(for MySQL)、云数据库(GeminiDB Redis)、云数据库(GeminiDB Mongo)、云数据库(GeminiDB Cassandra)、华为
云服务监控可收集云服务内置监控指标的数据,您可以通过监控这些指标来跟踪对应云服务状态。除了查看监控数据,您还可以在云服务监控页面创建告警规则和导出原始监控数据。 查看监控指标 在监控指标页面上,您可以查看基于近1小时、近3小时 、近12小时、近 24小时、近7天和近30天收集的原始数据的图表。您可以自
云服务授权 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。 前提条件 AOM
最新时间点所有集群的CPU使用率的平均值和所有集群的内存使用率的平均值。 应用监控卡片 图2 应用监控 此卡片主要展示应用监控的指标数据。 应用、组件、容器和实例的运行状态。 选择一个应用,可呈现该应用的如下信息: 近30分钟网络流量数据的趋势图,趋势图每1分钟一个点,趋势图每一
0。 AOM 2.0与AOM 1.0的功能有哪些区别? AOM 2.0基于AOM 1.0原有功能,结合用户常用的应用监控,增加了多种指标和日志数据的采集与监控,并对监控结果可视化呈现。同时,通过自动化运维功能将日常运维操作服务化、自动化,减少运维人员重复性操作。详细的功能对比请参见AOM
变量的描述。最多可输入1024个字符。 数据源 数据的来源。在仪表盘页面选择,此处灰化不可选。可以选择default类型的Prometheus实例和自定义创建的Prometheus实例,默认选择default类型的Prometheus实例。 支持选择的数据源类型:Prometheus for
支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 2021-10-20 支持创建告警行动策略。关联SMN主题与消息模板,通过创建消息模板,自定义通知消息配置。
不支持基于CMDB模型,对指标数据分层监控。 支持 容器洞察 从工作负载和集群2个维度监控CCE的资源使用、状态和告警等信息,以便快速响应,保证工作负载顺畅运行。 支持 支持 指标浏览 实时监控日志数据和各资源的指标数据及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看业务及分析数据关联分析。
一键迁移 引导用户快速将仪表盘和告警规则数据从AOM 1.0一键迁移至AOM 2.0。 注意事项 告警规则一键迁移提供全量规则迁移和迁移结果查询的能力。 后台判断用户是否进行过迁移(迁移状态:未迁移,迁移中,迁移完成) 如果进行过迁移,显示迁移完成的弹框。 如果没有进行过迁移,显示一键迁移的弹框。
简介 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS