-
通过helm部署pod的yaml文件后,AOM无法检测到工作负载 - 应用运维管理 AOM
通过helm部署pod的yaml文件后,AOM无法检测到工作负载 问题描述 通过helm部署pod的yaml文件后,AOM无法检测到工作负载。 原因分析 通过对比helm部署pod的yaml文件和在CCE控制台部署的pod yaml文件,发现helm部署pod的yaml文件中缺少env参数。
-
什么是应用运维管理 - 应用运维管理 AOM
可观测性分析 基于四层指标体系(基础设施层指标、中间件层指标、应用层指标和业务层指标),通过事务监控、容器监控、普罗监控等功能,提供异常检测、历史数据分析、性能分析、关联性和场景化分析等可观测性分析能力。 运维自动化 提供批量磁盘清理、作业编排、脚本执行等功能,将日常运维操作服务化、标准化、自动化。
-
Redis组件接入 - 应用运维管理 AOM
规范对外提供数据。 图2 安装Exporter 参数 说明 Redis地址 Redis的IP地址和端口号,例如:127.0.0.1:3306。 Redis密码 Redis的密码。 单击“立即创建”,即可完成Redis插件接入。已接入的插件会显示在采集任务页面。单击对应的采集任务名
-
Redis Exporter接入 - 应用运维管理 AOM
Redis Exporter接入 操作场景 使用数据库Redis过程中需要对Redis运行状态进行监控,以便了解Redis服务是否运行正常,及时排查Redis故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Redis运行状态。本文为您介绍
-
Redis Exporter接入 - 应用运维管理 AOM
Redis Exporter接入 操作场景 使用数据库Redis过程中需要对Redis运行状态进行监控,以便了解Redis服务是否运行正常,及时排查Redis故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Redis运行状态。本文为您介绍
-
创建指标告警规则 - 应用运维管理 AOM
clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。
-
智能洞察概述 - 应用运维管理 AOM
N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。 事件根因分析:提供基于应用性能管理APM平台的调用链追踪根因定位技术。可以从应用服务和流量Top N接口的指标、调用链维度,全局分析问题,快速诊断并定位故障根因。 优势 从周期性、稳定性和自相关性等多维度对数据进行特征提取,自动检测指标异常。 基于应用服务和流量Top
-
产品架构 - 应用运维管理 AOM
中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层 AOM提供告警、日志、监控、指标等基础运维服务,同时也提供异常检测与分析等AI服务。
-
事件巡检 - 应用运维管理 AOM
TopN接口平均响应时间突增:默认对流量Top 5的接口进行检测,基于接口历史3小时数据,判断最近10分钟平均响应时间是否有异常突增点。 图7 TopN接口平均响应时间突增 TopN接口错误率突增:默认对流量Top 5的接口进行检测,基于接口历史3小时数据,判断最近10分钟错误率是否有异常突增点。
-
容器洞察 - 应用运维管理 AOM
容器洞察 通过helm部署pod的yaml文件后,AOM无法检测到工作负载
-
基础指标:CSE指标 - 应用运维管理 AOM
本地主动请求检测失败率超阈值的驱逐次数 主机因本地主动请求检测失败率超阈值的驱逐次数。 ≥0 次 envoy_cluster_ejections_detected_local_origin_success_rate 本地主动请求检测成功率未达阈值的驱逐次数 主机因本地主动请求检测成功率
-
创建应用性能监控告警规则 - 应用运维管理 AOM
clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(>=、<=、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。
-
产品优势 - 应用运维管理 AOM
构建指标告警、事件告警、日志告警的统一告警体系,提供分组、抑制和静默等告警降噪策略,结合告警通知和订阅等功能,帮助用户从容应对海量告警风暴,快速检测和修复业务告警。 统一可视化 支持对多种数据源,在同一个仪表盘中统一监控与分析,并以折线图、数字图等形式多样化、可视化呈现,帮助用户快速监
-
应用场景 - 应用运维管理 AOM
跨云服务的分布式应用监控:对于同时使用了多种云服务的分布式应用,提供统一的运维平台,便于您对业务进行立体排查。 告警灵活通知:提供多种异常检测策略并支持丰富的异常告警触发方式及API。 图1 巡检与问题定界 立体化运维 您需全方位掌控系统的运行状态,并快速响应各类问题。 AOM提
-
快速管理容器 - 应用运维管理 AOM
clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(>=、<=、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。
-
概述 - 应用运维管理 AOM
插件。 中间件插件:是内置的中间件插件,不支持修改、删除和查看详情。目前中间件插件有如下几种: MYSQL:MySQL采集器 REDIS:Redis采集器 MONGODB:MongoDB采集器 KAFKA:Kafka采集器 NGINX:Nginx采集器 NODE:Node采集器 HAPROXY:HAProxy采集器
-
添加或修改应用发现规则(即将下线) - 应用运维管理 AOM
该接口用于添加或修改一条或多条应用发现规则。同一projectid下可添加的规则上限为100条。 URI PUT /v1/{project_id}/inv/servicediscoveryrules 请求消息 请求参数 请求参数如表1所示。 表1 请求参数 参数 是否必选 参数类型 取值范围 描述 appRules
-
数据订阅 - 应用运维管理 AOM
9b04-333333333333333"},{"name":"clusterName","value":"test-vss-111"},{"name":"diskDevice","value":"vda"},{"name":"master","value":"true"}]},
-
快速管理应用 - 应用运维管理 AOM
clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(>=、<=、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。
-
数据订阅 - 应用运维管理 AOM
33333333333333"},{"name":"clusterName","value":"test-aom-4-vss-111"},{"name":"diskDevice","value":"vda"},{"name":"master","value":"true"}]},