检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
APM配置 AOM作为华为云服务可观测性分析统一入口,自身并不具有应用性能管理服务的功能,AOM 2.0控制台中APM配置相关功能由应用性能管理APM提供。用户可在AOM 2.0控制台界面操作,也可登录APM控制台界面操作。 当前仅华东-上海一区域可以直接使用APM配置功能,其余
接入中心 接入中心总览 接入管理 监控JAVA应用 监控Node.js应用
该任务中配置的执行机已被删除或无权限,则执行时会忽略这些执行机,不显示在执行日志中。 解决方法 自动化运维在执行任务时会校验任务参数中的有效的执行机,请检查当前任务中配置的执行机是否都有效。 父主题: 运维管理(日落)
当您完成了安装ICAgent、配置服务发现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,
产品优势 兼容开放 支持各类开源协议低门槛接入,开放了运营、运维数据查询接口和采集标准,提供全托管、免运维、低成本的云原生监控能力。 开箱即用 无需修改业务代码即可接入使用, 非侵入式数据采集,安全无忧。 丰富的数据源 融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源。
简介 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS
修订记录 表1 版本说明列表 日期 修订记录 2023-09-30 新增以下章节: AOM与CES的云服务监控功能对比 安全 优化以下章节: 基础指标:容器指标 2023-09-15 删除“计费说明”章节。 2023-08-04 删除“基础指标-云服务指标”章节。 2023-06-30
App监控 AOM作为华为云服务可观测性分析统一入口,自身并不具有APM服务的功能,AOM 2.0控制台中App监控相关功能由应用性能管理APM提供。用户可在AOM 2.0控制台界面操作,也可登录APM控制台界面操作。 App监控功能当前仅在华东-上海一区域开放。 表1 功能说明
例如,可将重要资源的关键指标添加到仪表盘中,从而实时地进行监控。还可将不同资源的同一指标展示到同一个图形界面上进行对比。另外,对于例行运维需要查看的指标,可添加到仪表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。 告警管理 告警列表是告警和事件的管理平台。
计费说明 计费说明 应用运维管理服务(简称AOM)提供基础版、按需版两种计费方式。其中按需版分为按量后付费和预付费套餐包(其中预付费套餐包又分为专业版套餐包和企业版套餐包),计费详见AOM-价格说明。 AOM与其他云服务组合使用,为您提供通知发送、日志转储、性能管理等功能,这些功
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。 AK/SK 访问密钥。通过提供
快速分析日志 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。
查看告警 查看告警 在左侧导航栏中选择“告警 > 告警列表”。 在“告警列表”页面中查看告警。 设置时间范围,查看已设时间范围内产生的告警。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时、近一天等,您可根据实际需要选择不同的时间粒度。
查看事件 事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 查看事件 在左侧导航栏中选择“告警 > 事件列表”。 在“事件列表”页面中查看事件。 设置时间范围,查看已设时间范围内产生的事件。可通过如下两种方式设置时间范围:
告警降噪 概述 创建分组规则 创建抑制规则 创建静默规则 父主题: 告警管理
查看事件 事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您可根据需要对事件进行处理。用户可通过“事件”页面查看需要关注的事件,监控系统运行情况。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警列表”。
查看告警 告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。“告警列表”页面提供告警查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能:
接入管理 AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中“接入管理”功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“接入管理”功能。
接入管理 概述 将Prometheus的数据上报到AOM 通过grafana查看AOM中的指标数据 父主题: 配置管理