检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看告警 告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。“告警列表”页面提供告警查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能:
创建阈值规则 通过阈值规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 创建方式 阈值规则的创建方式分为两种:自定义阈值规则和使用模板创建阈值规则。一次创建后,只生成一条规则,无论是一个还是多个资源,均通过同一条规则进行
AOM最佳实践汇总 本文汇总了应用运维管理(AOM,Application Operations Management)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴
基础指标:容器指标 介绍通过CCE的kube-prometheus-stack插件或者自建K8s集群上报到AOM集群容器指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Target名称 Job名称 指标 指标含义 serviceMonitor/monitoring/coredns/0
创建用户并授权使用AOM 如果您需要对您所拥有的AOM进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的华为云账号中,给企业中不同职能部门的员工创建IAM用户
APM配置 AOM作为华为云服务可观测性分析统一入口,自身并不具有应用性能管理服务的功能,AOM 2.0控制台中APM配置相关功能由应用性能管理APM提供。用户可在AOM 2.0控制台界面操作,也可登录APM控制台界面操作。 当前仅华北-乌兰察布二零一、华北-北京一、华南-广州、
概述 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,提供一站式可观测性分析和自动化运维方案,支持快速从云端、本地采集指标、日志和性能数据,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行
创建用户并授权使用AOM 如果您需要对您所拥有的AOM进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的华为云账号中,给企业中不同职能部门的员工创建IAM用户
云审计服务支持的AOM操作列表 AOM为运维人员提供一站式立体运维平台,实时监控应用、资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker
按需计费 按需计费是一种先使用再付费的计费模式,适用于无需任何预付款或长期承诺的用户。本文介绍按需计费AOM的计费规则。 适用场景 按需计费适用于具有不能中断的短期、突增或不可预测的应用或服务,例如电商抢购、临时测试、科学计算。 适用计费项 按照用户实际使用的自定义指标上报量、指标存储时长、数据转储量计费。
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
日志分析(新版) AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中日志管理、日志接入、日志转储、日志加工相关功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 需要先购买云日志服务的相关功能,才可以使用AOM
查看组件性能指标 您可以在组件列表查看各组件的性能指标。例如:url调用次数、url平均响应时间、url错误率、mysql错误率等。您还可以在组件详情页面查看拓扑、接口调用、基础监控等性能监控项信息。 查看组件性能指标 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
应用资源管理(即将下线) 为什么购买的资源在“资源管理”界面看不到? “我的资源”已经释放删除了,为什么还会在界面展示? 为什么CMDB资源管理已经看到资源了,绑定环境的时候找不到资源? 搜索应用时,系统提示“AOM.11007006: get policy list failed
升级ICAgent 为了更好的采集体验,AOM会不断更新ICAgent版本。当系统提示您有新的ICAgent版本时,您可以按照如下操作步骤进行升级。 如果ICAgent存在严重的bug时,系统会对采集的版本进行升级。 在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右
应用监控 应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。应用的类型包括系统应用和自定义应用,通过内置发现规则发现的是系统应用,通过自定义规则发现的是自定义应用。 在AOM的应用发现界面配置应用发现规则,可自动发现符合规则的应用并监控相关指标,详情请参考应用发现。
自定义 Prometheus 格式指标接入AOM 操作场景 您可以接入自定义 Prometheus格式的指标,并支持自动上报到AOM。 前提条件 已接入ECS类型Prometheus监控,详情请参见创建ECS Prometheus实例。 已创建主机组,详情请参见管理主机组。 如需使用自定义
高危命令说明 高危命令指影响系统或服务的正常运行,或造成系统特殊文件被恶意删除或修改命令。自动化运维服务涉及的高危命令请参见表1。 表1 高危命令说明 高危命令名称 高危命令校验规则 样例 导致风险 vi /etc/xxx.xx command \\s*(vi|vim)\\s+/
监控JAVA应用和Node.js应用 AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持将应用层组件JAVA应用和Node.js应用的调用链接入APM,来监控应用相关的性能图表或接口性能指标等。 监控JAVA应用:AOM支持通过快速接入Agent来监控JAVA应用,以及
仪表盘监控 通过系统预置的仪表盘模板,用户可以快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 前提条件 服务已接入云服务类型Prometheus监控并接入云服务,具体请参见Prometheus实例 for