检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过Debugging诊断代码 查看组件接口调用监控项 查看组件基础监控项 查看组件异常日志 查看组件外部调用监控项 查看组件通信协议监控项 查看组件数据库监控项 查看组件Web容器监控项 查看组件消息队列监控项 查看组件远程过程调用监控项 查看组件日志监控项 查看组件基础设施监控项 查看组件调用链监控项
指标。 不支持 支持 仪表盘 将不同图表展示到同一个屏幕上,通过多种图表形式展示资源的指标、日志和性能数据。 部分支持 只支持指标数据和系统性能数据的可视化监控,不支持日志数据的监控。 支持 告警管理 对服务设置事件条件或者对资源的指标设置阈值条件,当AOM自身或外部服务存在异常
过程中可能出现的异常问题。 数据源 源日志组 日志数据来源的日志组,请从下拉列表中选择。若下拉列表中没有合适的日志组,请单击“创建日志组”新建。 日志数据默认存储30天,可以在1-30天之间设置。超出存储时间的日志将会被自动删除,您可以按需将日志数据转储至OBS桶中长期存储。 如
Recording Rule配置完成后,可通过如下方式查看指标数据。 方式一:通过AOM的“指标浏览”页面查看配置了Recording Rule的Prometheus实例的指标数据。 方式二:通过Grafana查看AOM中的指标数据。 父主题: Prometheus监控
Prometheus监控 当指标或事件满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。 日志监控 当日志数据满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。 云监控 AOM 2.0控制台中创建监控数据来源为“云监控”类型的告警通知规则功能由云监控服务
指标告警规则 通过指标告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 应用性能监控告警规则 通过创建应
概述 AOM提供告警行动规则定制功能,当资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 通过创建告警行动规则关联SMN主题与消息模板。 通过创建消息模板,自定义通知消息配置。 告警行动规则创建成功后,可在“告警> 告警降噪> 分组规则”中“创建分组规则”关联行动规则。
集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。 约束与限制 主机状态包含“正常”、“异
单击右上角的,可实时获取到该云服务全部实例的最新信息。 单击任一实例名称,在对应实例页签中监控云服务实例各指标的数据曲线。 在页面右上角设置指标信息的统计周期,查看不同时间段的历史数据。 设置时间范围,查看已设时间范围内上报的指标。可通过如下两种方式设置时间范围: 方式一:使用AOM预定
在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
统计方式:指标数据按照所设置的统计方式进行聚合。 阈值条件:阈值告警的触发条件,由判断条件(≥、≤、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 连续周期:连续多少个周期满足阈值条件后,发送阈值告警。 统计周期:指标数据按照所设置的统计周期进行聚合。
一键迁移 引导用户快速将仪表盘和告警规则数据从AOM 1.0一键迁移至AOM 2.0。 注意事项 告警规则一键迁移提供全量规则迁移和迁移结果查询的能力。 后台判断用户是否进行过迁移(迁移状态:未迁移,迁移中,迁移完成) 如果进行过迁移,显示迁移完成的弹框。 如果没有进行过迁移,显示一键迁移的弹框。
则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。 约束与限制 配置的日志接入LTS规则可能会影响LTS中的日志数据,产生额外的费用,请谨慎操作。 配置接入规则 将AOM中的CCE、CCI或自定义集群的日志映射至LTS需要进行如下操作步骤: 登录AOM 2
在左侧导航栏选择“认证管理”,然后在右侧区域单击“创建AccessCode”。 在弹出的“创建AccessCode”对话框中单击“立即生成”,系统自动为当前用户生成AccessCode。 其他相关操作 AccessCode创建完成后,您还可以对AccessCode列表执行表1中的操作。
适用计费项 按照用户实际使用的自定义指标上报量、指标存储时长、数据转储量计费。 表1 计费项说明 计费项 计费说明 自定义指标上报量 自定义指标上报量即采样点数量,采样点数量计算方式遵循开源Prometheus的数据模型。一条采样点数据包含指标名称、Label集合、采样时间时间戳及取值这几
期,最多可监控30个连续周期指标数据。在告警规则详情中选择“满足全部条件触发”的计算方式时,不支持使用告警恢复功能。 例如,设置连续周期为“2”,则表示连续2个周期不满足告警条件,恢复告警。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者
在下拉列表中选择想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
自定义指标上报量 自定义指标上报量即采样点数量,采样点数量计算方式遵循开源Prometheus的数据模型。一条采样点数据包含指标名称、Label集合、采样时间时间戳及取值这几个部分,采样点以时间线的方式在逻辑上组织起来。例如,kube_node_status_allocatable
搜索同时包含start和unexpected的日志数据:start && unexpected。 搜索同时包含start和unexpected的日志数据:start AND unexpected 或者 start and unexpected。 搜索包含start或者unexpected的日志数据:start ||