检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用监控概述 查看应用性能指标 监控组件性能指标 通过全局拓扑图查看应用间调用关系 通过调用链查看微服务间调用关系 管理APM探针启停状态 APM配置
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
us实例相关的中间件采集任务。 表1 相关操作 操作 说明 查看采集任务 单击采集任务名称,跳转到采集任务的详情页,可以查看该采集任务的详细配置信息。 启动/停用采集任务 单击采集任务对应启停列下的按钮,可控制采集任务开启和暂停。 搜索采集任务 在采集任务列表上方的搜索框输入关键字等搜索条件,搜索对应采集任务。
定义页面呈现的内容。例如,通过API接口查询AOM阈值规则,并将数据呈现在通用表格中。如何通过接口查询AOM监控的阈值规则,请参见查询阈值规则列表。 新建转换器。 在使用OpenAPI中alarm的内容时,需要通过转换器将所需的字段转换为您所需要的格式。本示例中,需要将数据转换为数组格式。
default 描述 规则的描述信息,最多可输入1024个字符。本示例可不填写。 - 设置告警规则的详细信息。 告警规则设置中的规则类型、配置方式、Prometheus 实例默认选择为指标浏览处的配置。 设置告警规则详情。指标与条件自动选择为指标浏览处配置,统计周期、检测规则等参数可按需设置。
告警是指AOM自身或外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。 图1 告警管理使用流程 父主题:
OM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。 什么是映射 AOM中的日志实际上是以一个日志流的形式在LTS中存在(如图1中的AOM日志流所示),AOM可以查询已配置采集路径的原始日志,但当前AOM的日志流
OM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。 约束与限制 AOM日志接入LTS功能当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 什么是映射 AOM中的日志实际上是以一个日志流的形式在
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态。单击
计费模式概述 AOM支持按需计费方式。按照用户实际使用的自定义指标上报量、指标存储时长、数据转储量计费。先使用,后付费。 按需计费模式允许您根据实际业务需求灵活地调整资源使用,无需提前预置资源,从而降低预置过多或不足的风险。 父主题: 计费模式
指定上报的事件或者告警产生的时间。仅支持CST毫秒级时间戳。 例如:2024-10-16 16:03:01需要通过工具转换成CST毫秒级时间戳:1729065781000 当action值为空时,即上报事件或告警时需要时指定该参数。 ends_at 否 Long 指定清除的事件或者
首次配置一次性转储到未授权的OBS桶中时,AOM服务会授权给OBS桶ACL规则,授权生效需要15分钟,如果您第一次配置一次性转储后失败,请15分钟后重试。 obs-store-test 所属桶目录 OBS桶中存储日志的目录。 说明: 如果不配置,则日志默认存储在OBS桶的根目录下。
日志费用说明 初次使用AOM时,默认为您开通基础版套餐包,该版本包含免费额度,如日志读写流量免费额度为500MB,超过额度的部分将自动按需收费。 AOM中日志相关功能由云日志服务LTS提供,并由LTS统一上报日志、话单,AOM不重复计费。如需停止计费请参见:如何停止日志功能,不再收费?
<100(例如,已打印90条日志),该日志之后已打印的日志条数 <99(例如,已打印80条日志),则该日志之前的90条和之后的80条日志会被作为上下文显示。 单击“导出本页”,可将已显示的日志上下文原始数据导出到本地。 为了保障租户主机和组件的正常运行,租户的主机上会运行部分系统提供的组件(例如,kube-d
告警监控 AOM告警监控概述 配置AOM告警通知 配置AOM告警规则 查看AOM告警或事件 配置AOM告警降噪
和全局allglen变量计算得来。由于sched结构体的所有字段可能并发的更改,因此最后会检查计算的值是否小于1,如果小于1,那么返回1。 scrape_duration_seconds 采集scrape target花费的时间 node_load15 节点15分钟CPU负载 s
orter的方式来监控Redis运行状态。本文为您介绍如何使用Prometheus监控Redis。 其他Exporter接入AOM实现指标监控 如果您所使用的基础组件还没有提供相应的集成方式,可以参考如下方式进行集成,以及自定义监控大屏来满足相应的监控需求。 当前支持的中间件Ex
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
通过AOM监控应用进程 应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。应用的类型包括系统应用和自定义应用,通过内置发现规则发现的是系统应用,通过自定义规则发现的是自定义应用。应用列表展示了每个应用的名称、运行状态、部署方式等信息。AOM支持从应用下钻到组件,再从组件下钻到
当前仅华南-广州区域的菜单路径为“接入中心 > 接入管理”。 单击“接入指标”,在“接入中心”弹框中选择需要接入的卡片,具体操作请参见接入中心总览。 接入完成后,即可在“接入管理”的“指标接入规则”页签下查看配置的指标接入规则。 您还可以根据需要执行表1中的相关操作。 表1 相关操作