已找到以下 26 条记录
AI智能搜索
产品选择
应用运维管理 AOM
没有找到结果,请重新输入
产品选择
应用运维管理 AOM
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 开通智能洞察 - 应用运维管理 AOM

    功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。 事件根因分析:提供基于应用性能管理APM平台的调用链追踪根因定位技术。可以从应用服务和流量Top N接口的指标、调用链维度,全局分析问题,快速诊断并定位故障根因。

  • 应用场景 - 应用运维管理 AOM

    深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、日志分析、服务异常报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。

  • 什么是应用运维管理 - 应用运维管理 AOM

    可观测性分析 基于四层指标体系(基础设施层指标、中间件层指标、应用层指标和业务层指标),通过事务监控、容器监控、普罗监控等功能,提供异常检测、历史数据分析、性能分析、关联性和场景化分析等可观测性分析能力。 运维自动化 提供批量磁盘清理、作业编排、脚本执行等功能,将日常运维操作服务化、标准化、自动化。

  • 通过华为云标签(Tag)分发告警 - 应用运维管理 AOM

    s 实例默认选择为指标浏览处的配置。 设置告警规则详情。指标与条件自动选择为指标浏览处配置,统计周期、检测规则等参数可按需设置。 如图3所示,“统计周期”设置为“1分钟”,“检测规则”设置为“平均值>0.5”,“触发条件”设置为“连续周期 3”,“告警级别”设置为,表示监控对象连续3个周期平均值大于0

  • 应用监控 - 应用运维管理 AOM

    在组件层,主要监控组件的告警信息。支持从组件层面查询活动告警与历史告警,快速修复告警问题。 图1 组件监控 环境监控 在环境页面,以环境概览、日志、性能、调用链、告警的形式,深度的监控和分析环境的核心指标。针对预发环境、生产环境按环境进行指标观测,监控环境的进程状况、应用性能(错误数、请求数、平均响应时间)、告警分

  • 什么是应用运维管理 - 应用运维管理 AOM

    维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体验、如何将散落的日志进行关联分析、如何快速追踪问题。

  • 创建AOM指标告警规则 - 应用运维管理 AOM

    clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。

  • 产品架构 - 应用运维管理 AOM

    据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层 AOM提供告警、日志、监控、指标等基础运维服务,同时也提供异常检测与分析等AI服务。

  • 通过AOM查看事件巡检数据 - 应用运维管理 AOM

    5的接口进行检测,基于接口历史3小时数据,判断最近10分钟Top 5接口平均响应时间是否有异常突增点。 应用服务整体错误率突增:基于应用历史3小时数据,判断最近10分钟应用服务整体错误率是否有异常突增点。 TopN接口错误率突增:默认对流量Top 5的接口进行检测,基于接口历史3小时数据,判断最近10分钟Top

  • 基础指标:CSE指标 - 应用运维管理 AOM

    本地主动请求检测失败率超阈值的驱逐次数 主机因本地主动请求检测失败率超阈值的驱逐次数。 ≥0 次 envoy_cluster_ejections_detected_local_origin_success_rate 本地主动请求检测成功率未达阈值的驱逐次数 主机因本地主动请求检测成功率

  • 创建AOM应用性能监控告警规则 - 应用运维管理 AOM

    clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(>=、<=、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。

  • 建设完整指标体系,实现立体化监控 - 应用运维管理 AOM

    设置告警规则详情。 指标的详细设置由统计周期、条件、检测规则、触发条件以及告警级别组成。指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(>=、<=、>、<)和阈值组成。例如,统计周期为“1分钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3

  • 与其他服务的关系 - 应用运维管理 AOM

    云容器引擎服务(Cloud Container Engine,简称CCE)是提供高性能可扩展的容器服务,基于云服务器快速构建高可靠的容器集群,深度整合网络和存储能力,兼容Kubernetes及Docker容器生态。帮助您轻松创建和管理多样化的容器工作负载,并提供容器故障自愈,监控日志采集,自动弹性扩容等高效运维能力。

  • 产品优势 - 应用运维管理 AOM

    构建指标告警、事件告警、日志告警的统一告警体系,提供分组、抑制和静默等告警降噪策略,结合告警通知和订阅等功能,帮助用户从容应对海量告警风暴,快速检测和修复业务告警。 统一可视化 支持对多种数据源,在同一个仪表盘中统一监控与分析,并以折线图、数字图等形式多样化、可视化呈现,帮助用户快速监

  • 监控云容器引擎 CCE的指标 - 应用运维管理 AOM

    集群名称=aom-doc-test AND 工作负载名称=coredns 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。 不分组 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。 “平均值 > 10” 触发条件

  • 快速入门 - 应用运维管理 AOM

    clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。

  • 通过AOM告警分组规则清除ELB告警风暴 - 应用运维管理 AOM

    指标监控的维度。不设置则表示选中全部资源。本示例可不填写。 - 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。 不分组 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。 “平均值 < 1” 触发条件

  • 使用Prometheus监控ECS主机的指标(新版) - 应用运维管理 AOM

    指标监控的维度。不设置则表示选中全部资源。本示例可不填写。 - 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。 不分组 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。 “平均值 > 1” 触发条件

  • 使用Prometheus监控ECS主机的指标 - 应用运维管理 AOM

    指标监控的维度。不设置则表示选中全部资源。本示例可不填写。 - 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。 不分组 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。 “平均值 > 1” 触发条件

  • 通过多账号聚合Prometheus实例实现指标数据统一监控 - 应用运维管理 AOM

    处选择的指标。 指标的详细设置由统计周期、条件、检测规则、触发条件以及告警级别组成。指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(>=、<=、>、<)和阈值组成。例如,统计周期为“1分钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3