检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
进行自定义的子用户权限配置,从而达成子用户云服务资源展示控制效果。 管理指标或事件(prometheus监控)告警规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警规则”,默认显示“指标或事件”页签。当前仅华南-广州区域的菜单路径为“告警中心 > 告警规则”
通过Grafana查看Prometheus实例数据 将云服务或CCE集群接入Prometheus实例后,即可通过Grafana查看AOM中相关集群或云服务的指标数据。 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。
中间件接入AOM MySQL指标接入AOM Redis指标接入AOM Kafka指标接入AOM Nginx指标接入AOM MongoDB指标接入AOM Consul指标接入AOM HAProxy指标接入AOM PostgreSQL指标接入AOM Elasticsearch指标接入AOM RabbitMQ指标接入AOM
中间件接入AOM总览 MySQL指标接入AOM Redis指标接入AOM Kafka指标接入AOM Nginx指标接入AOM MongoDB指标接入AOM Consul指标接入AOM HAProxy指标接入AOM PostgreSQL指标接入AOM Elasticsearch指标接入AOM RabbitMQ指标接入AOM
图所示。 统计规则以日志桶为单位, AOM会周期统计关键词在日志桶的日志文件中出现的条数,并生成日志指标。 图1 创建统计规则 统计规则创建完成后,会生成以统计规则名称命名的指标。 更多统计规则操作 创建完统计规则后,您还可以执行更多统计规则操作中的操作。 表1 相关操作 操作 说明
管理Prometheus实例指标数据 使用Prometheus监控CCE集群指标 配置多账号聚合实现指标统一监控 配置CCE集群监控采集指标规则 配置预聚合规则提升指标查询效率 配置数据多写实现监控指标转储到自建Prometheus 配置指标存储时长 通过仪表盘监控Prometheus实例指标数据 配置Remote
在环境页面,以环境概览、日志、性能、调用链、告警的形式,深度的监控和分析环境的核心指标。针对预发环境、生产环境按环境进行指标观测,监控环境的进程状况、应用性能(错误数、请求数、平均响应时间)、告警分布等核心指标。同时监控主机、进程、容器、云服务、性能监控、日志分析等信息。 图2 环境监控
异常 当有级别为紧急或重要的告警时资源状态为异常。 修复建议:请在告警界面参考告警详细信息处理告警。 通道静默 当ICAgent无法采集资源的指标时资源状态为通道静默,通道静默可能由于但不限于以下原因导致: 可能原因一:ICAgent问题 修复建议:在左侧导航栏中选择“配置管理 >
2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 2021-10-20 支持创建告警行动策略。关联SM
23版本集群containerd节点容器网络指标缺失问题 支持采集EulerOS 2.5系统的磁盘分区指标 5.12.133 容器的标准输出日志支持多行采集。 5.12.130 支持将CCE日志直接接入LTS。 5.12.120 增加进程的最大句柄数指标。 支持LTS的podlb域名的切换能力。
解决方案,为业务健康和稳定保驾护航。 本入门以业务指标监控大屏为例,向您介绍如何将AOM中的监控数据呈现在大屏页面中,以及如何对页面进行二次开发。业务指标监控大屏统一接入了业务告警、前端性能监控、集群以及云服务指标。通过对业务指标的实时监控,实现业务的实时观察。 约束与限制 如果
的多少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 约束与限制 快速分析的对象为结构化日志中提取的关键字段,创建快速分析前请先对原始日志进行结构化配置。
查看AOM审计事件 AOM为运维人员提供一站式立体运维平台,实时监控应用、资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kuber
信息;通过配置分词可将日志内容按照分词符切分为多个单词,在日志搜索时可使用切分后的单词进行搜索。 指标浏览 指标浏览展示了各资源的指标数据,您可实时监控指标值及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看业务及分析数据关联分析。
创建告警规则(按全量指标创建) 03:45 创建告警规则(按全量指标创建) 应用运维管理 AOM 创建告警规则(按Prometheus命令创建) 04:08 创建告警规则(按Prometheus命令创建) 应用运维管理 AOM 通过虚机接入方式接入中间件指标 03:54 通过虚机接入方式接入中间件指标
)。主机可以在ECS、BMS直接购买,也可以通过CCE间接购买。 安装ICAgent(必选) ICAgent是AOM的采集器,用于实时采集指标、日志和应用性能数据。对于在ECS控制台直接购买的主机,您需要手动安装ICAgent。对于通过CCE购买的主机,ICAgent会自动安装。
题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、日志分析、服务异常报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。 优势 应用自动发现:自动部署采集
云审计服务支持的AOM操作列表 AOM为运维人员提供一站式立体运维平台,实时监控应用、资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker
通过AOM查看事件根因分析结果 智能洞察提供异常事件快速根因定位分析的功能。根因分析基于事件巡检看护的服务历史数据,根据服务指标、调用链数据进行下钻分析,细粒度定位事件根因。 查看事件根因分析结果 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角
如何将Prometheus数据接入到AOM? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? 如何获取Prometheus实例的服务地址? 不能废弃以aom_prom_fixed作为前缀的指标