检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据库GaussDB NoSQL、云数据库 GaussDB),网络(虚拟私有云VPC、弹性负载均衡器ELB、弹性公网IP EIP),应用中间件(分布式缓存DCS、分布式消息DMS(Kafka、RabbitMQ)),存储(对象存储服务OBS、云硬盘EVS、云备份CBR),函数工作流FunctionGraph。
日志/调用链 组件层接入AOM GO组件 Python组件 Node.js组件 PHP组件 .NET组件 C++组件 自建中间件接入 MySQL 日志/指标 中间件接入AOM Redis Kafka NGINX MongoDB Consul HAProxy PostgreSQL ElasticSearch
针对容器场景:容器资源、容器中间件等指标存储在Prometheus for CCE类型的实例中。 如果需要关联分析,需要先在AOM中创建Prometheus for CCE实例,并在Prometheus实例中一键接入容器监控。 针对虚机场景:虚机、虚机上的自建中间件等资源指标存储在Prometheus
eus实例中。 当前仅CCE类型Prometheus实例支持。 接入中心 AOM集成Prometheus中间件插件,支持在Prometheus实例的“接入中心”为虚机安装中间件Exporter,将上报指标到指定的ECS Prometheus实例中。 当前仅ECS类型Prometheus实例支持。
最多可创建三层子应用。子应用可以理解为服务,对组件/微服务的归组分类。 组件:构成应用的最小单元,可以理解为应用程序或者应用依赖的一个中间件云服务组件,例如RDS,DMS。组件一般跟下面的环境一起组合使用,一个组件可以包含一个或者多个环境。比如一个订单的应用程序,包含功能测试环
环境标签 为已创建的应用环境添加标签,便于用户快速过滤和查找相同属性的应用环境。 资源监控 接入中心 快速接入需要监控的业务层、应用层、中间件层、基础设施层指标。 不支持 支持 仪表盘 将不同图表展示到同一个屏幕上,通过多种图表形式展示资源的指标、日志和性能数据。 部分支持 只支
置一条或多条日志采集路径。 您既可使用ICAgent自动识别的路径,也可手动配置。 使用ICAgent自动识别的路径 ICAgent会自动扫描您虚机的日志文件,自动发现虚机中所有持有文件句柄且类型为*.log、*.trace和*.out的日志文件及其路径,然后呈现在界面中供您选择。
功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。 事件根因分析:提供基于应用性能管理APM平台的调用链追踪根因定位技术。可以从应用服务和流量Top N接口的指标、调用链维度,全局分析问题,快速诊断并定位故障根因。
用环境、操作。 网络 弹性负载均衡器ELB - 名称/ID、资源状态、服务地址与所属网络、监听器、区域、企业项目、应用环境、操作。 应用中间件 分布式缓存DCS - 名称/ID、资源状态、缓存类型、实例类型、规格(GB)、IP地址、区域、企业项目、应用环境、操作。 分布式消息DMS
本地主动请求检测失败率超阈值的驱逐次数 主机因本地主动请求检测失败率超阈值的驱逐次数。 ≥0 次 envoy_cluster_ejections_detected_local_origin_success_rate 本地主动请求检测成功率未达阈值的驱逐次数 主机因本地主动请求检测成功率
5的接口进行检测,基于接口历史3小时数据,判断最近10分钟Top 5接口平均响应时间是否有异常突增点。 应用服务整体错误率突增:基于应用历史3小时数据,判断最近10分钟应用服务整体错误率是否有异常突增点。 TopN接口错误率突增:默认对流量Top 5的接口进行检测,基于接口历史3小时数据,判断最近10分钟Top
clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。
添加环境 组件创建完成后,可根据主机、区域等信息为组件添加不同的环境,方便统一管理各资源或应用。 添加环境 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 选择企业项目并在左侧导航栏中选择“应用管理”。 在左侧树节点,将光标移至待操作的组件名称后,单击。
据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层 AOM提供告警、日志、监控、指标等基础运维服务,同时也提供异常检测与分析等AI服务。
构建指标告警、事件告警、日志告警的统一告警体系,提供分组、抑制和静默等告警降噪策略,结合告警通知和订阅等功能,帮助用户从容应对海量告警风暴,快速检测和修复业务告警。 统一可视化 支持对多种数据源,在同一个仪表盘中统一监控与分析,并以折线图、数字图等形式多样化、可视化呈现,帮助用户快速监
clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(>=、<=、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。
根据组件名称查询组件详情 功能介绍 该接口用于查询组件详情。 调用方法 请参见如何调用API。 URI GET /v1/components/application/{application_id}/name/{component_name} 表1 路径参数 参数 是否必选 参数类型
s 实例默认选择为指标浏览处的配置。 设置告警规则详情。指标与条件自动选择为指标浏览处配置,统计周期、检测规则等参数可按需设置。 如图3所示,“统计周期”设置为“1分钟”,“检测规则”设置为“平均值>0.5”,“触发条件”设置为“连续周期 3”,“告警级别”设置为,表示监控对象连续3个周期平均值大于0
clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。
指标监控的维度。不设置则表示选中全部资源。本示例可不填写。 - 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。 不分组 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。 “平均值 < 1” 触发条件