检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
$event.annotations.tms_tags;”变量才会生效。 关闭“指标采集开关”后,ICAgent会停止虚机指标数据采集,相关指标数据不再更新,用户自定义指标还可以继续上报。 配置指标采集开关 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。
日志采集时间:ICAgent采集日志,并且发送到云日志服务的时间。 日志打印时间:系统产生并打印日志的时间。 时间通配符:用日志打印时间来标识一条日志数据,通过时间通配符来匹配日志,每条日志的行首显示日志的打印时间。 分行模式:当日志格式选择“多行日志”时需要选择每条日志的分行模式,分行模式
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
coredns_forward_conn_cache_hits_total 每个协议和数据流的缓存命中次数 coredns_forward_conn_cache_misses_total 每个协议和数据流的缓存未命中次数 coredns_forward_healthcheck_broken_total
管理APM探针启停状态 APM探针(Agent)通过字节码增强技术进行调用埋点,可运行在应用所在的服务器上,实时采集应用性能相关的数据。您可以管理APM探针启停状态。 管理APM探针启停状态。 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 探针管理”,进入探针管理页面。
aom:metric:list 查询时间序列 查询时间序列 aom:metric:list 查询时序数据 查询时序数据 aom:metric:get 查询指标 查询指标 aom:metric:get 查询监控数据 查询监控数据 aom:muteRule:delete 删除静默规则 无 删除静默规则 aom:muteRule:create
告警。默认只监控一个周期,最多可监控5个周期指标数据。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要启动或者关闭。 默认只监控一个周期,最多可监控5个周期指标数据。 系统处理方式包括:告警、数据不足并发送事件、保持上一个状态、正常。 图1 设置告警条件
故障传播链分析:提供基于应用性能管理APM平台的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 优势 从周期性、稳定性和自相关性等多维度对数据进行特征提取,自动检测指标异常。 基于应用服务和流量Top
日志搜索与分析(默认推荐) 日志搜索与分析(管道符方式-邀测) 日志应用 日志转储 主机和云服务的日志数据上报至AOM或LTS后,用户可根据需要设置存储时间。超出存储时间的日志数据将会被自动删除,对于需要长期存储的日志数据(日志持久化),通过日志转储功能,可以将日志转储至其他云服务中进行长期保存。 登录AOM
操作 参数 说明 选择实例 Prometheus实例 选择一个ECS Prometheus实例用于存储采集数据。 采集任务通过关联ECS Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。
云服务监控可收集云服务内置监控指标的数据,您可以通过监控这些指标来跟踪对应云服务状态。除了查看监控数据,您还可以在云服务监控页面创建告警规则和导出原始监控数据。 查看监控指标 在监控指标页面上,您可以查看基于近1小时、近3小时 、近12小时、近 24小时、近7天和近30天收集的原始数据的图表。您可以自
示。 设置完成后,监控的指标数据以折线图形式显示在告警条件上方,最多支持展示50条指标数据,单击每条指标数据前的折线符号可将对应指标数据在当前图表中隐藏。单击“新增指标”可多次添加监控指标,并为指标设置统计周期和检测规则等信息。 将光标移动到指标数据和对应告警条件后,还可以根据需要执行以下操作:
操作 参数 说明 选择实例 Prometheus实例 选择一个ECS Prometheus实例用于存储采集数据。 采集任务通过关联ECS Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。
操作 参数 说明 选择实例 Prometheus实例 选择一个ECS Prometheus实例用于存储采集数据。 采集任务通过关联ECS Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。
支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 2021-10-20 支持创建告警行动策略。关联SMN主题与消息模板,通过创建消息模板,自定义通知消息配置。
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警”
操作 参数 说明 选择实例 Prometheus实例 选择一个ECS Prometheus实例用于存储采集数据。 采集任务通过关联ECS Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。
操作 参数 说明 选择实例 Prometheus实例 选择一个ECS Prometheus实例用于存储采集数据。 采集任务通过关联ECS Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。
操作 参数 说明 选择实例 Prometheus实例 选择一个ECS Prometheus实例用于存储采集数据。 采集任务通过关联ECS Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。