检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在已设的监控周期内,当某个资源或资源的指标数据满足告警条件时,产生对应的告警。 可在左侧导航栏中选择“告警管理 > 告警列表”,在“告警”页签下查看该告警,具体请参见查看告警。 查看事件 在已设的监控周期内,当某个资源没有指标数据上报时,会产生一条数据不足的事件。 可在左侧导航栏中选择“告警管理
的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。
告警。默认只监控一个周期,最多可监控5个周期指标数据。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要启动或者关闭。 默认只监控一个周期,最多可监控5个周期指标数据。 系统处理方式包括:告警、数据不足并发送事件、保持上一个状态、正常。 图1 设置告警条件
创建消息模板 AOM提供消息模板功能,可通过创建消息模板自定义配置通知消息,当AOM触发已设定的告警通知策略时,可通过此功能以您自定义消息模板的邮件、短信、企业微信、钉钉、语音、HTTP或HTTPS形式通知指定的人员。如果您未创建任何消息模板,则采用默认消息模板。 创建消息模板 在左侧导航栏中选择“告警
ICAgent安装成功但是配置错误 ICAgent安装成功但是数据采集失败 解决方法 若ICAgent未安装成功,请重新安装ICAgent。 若ICAgent安装成功,但是无法监控到主机,通常有几种原因: 配置错误:Region名错误,或PODLB地址错误。 数据采集失败:调openstack接口失败,或采集的hostid为空。
适用计费项 按照用户实际使用的自定义指标上报量、指标存储时长、数据转储量计费。 表1 计费项说明 计费项 计费说明 自定义指标上报量 自定义指标上报量即采样点数量,采样点数量计算方式遵循开源Prometheus的数据模型。一条采样点数据包含指标名称、Label集合、采样时间时间戳及取值这几
CCE实例可以上报多个CCE集群数据。 开源兼容 支持自定义多维数据模型、HTTP API模块、PromQL查询。 静态文件配置和动态发现机制发现监控对象,实现轻松迁移及接入。 数据规模无上限 凭借云存储能力,数据存储无上限,不再受限于本地容量。云端分布式存储保障数据可靠性。 通过Prometheus实例
配置分词 通过配置分词可将日志内容按照分词符切分为多个单词,在日志搜索时可使用切分后的单词进行搜索。初次使用时,AOM已默认进行了分词配置,默认配置的分词符为: , '";=()[]{}@&<>/:\n\t\r 若默认分词符不能满足您的需求时,可按照如下操作进行自定义配置。 注意事项
云产品监控 无缝集成了多种云产品的监控数据。用户如果有云产品的监控需求,可以通过接入云产品监控实施。 指标 采集目标暴露的、可以完整反映监控对象运行或者业务状态的一系列标签化数据。Prometheus监控采用OpenMetrics的标准数据格式描述指标。 父主题: Prometheus监控简介
指标管理 仪表盘监控 数据多写 配置指标存储时长 接入指南 获取Prometheus实例的服务地址 Prometheus实例读写地址支持公网的局点 通过Remote Read方式读取Prometheus实例数据 自建Prometheus数据上报到AOM 通过Grafana查看Prometheus实例数据
通信协议监控项可以对通信协议的访问进行监控,可以监控的通信协议包含Websocket类型。 相关配置请参见查看组件通信协议监控项。 数据库 数据库监控项可以对数据库的访问进行监控,可以监控的数据库包含C3P0连接池、Cassandra、ClickHouse、DBCP、Druid、EsRestClient
选择Job:{namespace}/redis-exporter,可以查询到redis开头的指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。 配置仪表盘图表 登录AOM 2.0控制台。 在左侧菜单栏中选择“仪
在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。 配置的日志接入LTS规则可能会影响LTS中的日志数据,产生额外的费用,请谨慎操作。 添加接入规则 将AOM中的CCE、CCI或自定义集群的日志映射至LTS需要进行如下操作步骤: 登录AOM 2
选择Job:{namespace}/redis-exporter,可以查询到redis开头的指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。 配置仪表盘图表 登录AOM 2.0控制台。 在左侧菜单栏中选择“仪
境。每个环境都有region属性,可以通过region信息实现环境的过滤,也可以在创建环境时打上一个或多个标签,通过标签进行环境过滤。例如按照环境类型区分包括:正式、测试。 环境标签 为环境设置的一个属性,多个环境可能具有相同的的标签,通过标签可过滤显示需要的环境。同一个标签只能
中可能出现的异常问题。 数据源 源日志组 日志数据来源的日志组,请从下拉列表中选择。 若下拉列表中没有合适的日志组,请单击“创建日志组”新建。 说明: 日志数据默认存储30天,可以在1~30天之间设置。超出存储时间的日志将会被自动删除,您可以按需将日志数据转储至OBS桶中长期存储。
如何启用NGINX stub_status模块? Nginx Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,以root权限
手动升级 引导用户如何将AOM 1.0 的数据迁移至AOM 2.0 ,目前仅支持日志升级、采集器升级和告警规则升级功能。 功能介绍 日志升级 日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。
手动升级 引导用户如何将AOM 1.0 的数据迁移至AOM 2.0 ,目前仅支持日志升级、采集器升级和告警规则升级功能。 功能介绍 日志升级 日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。
云审计服务支持的AOM操作列表 AOM为运维人员提供一站式立体运维平台,实时监控应用、资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运