检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
息。 应用发现 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用和关联的指标。 日志配置 提供日志配额和分词设置功能。 配额配置 当指标超过配额时,时间较早的指标将会被删除。 指标配额可通过切换基础版(受限免费)和按需版(按需计费)来修改。 指标配置 指标采集开关用来
min{4G,节点物理内存/2}表示取“节点物理内存的一半”和“4G”中的较小值。 日志文件的采集,包含了syslog、容器标准输出、用户配置路径、容器挂载等多种方式的日志文件采集。 资源消耗:此类数据采集时,采集器ICAgent对资源的消耗和文件日志量、文件个数及网络带宽、backend服务处理能力等多种因素强相关。
AOM将陆续支持其他各种类型插件的接入功能,您可以在安装了UniAgent的主机列表界面,直接对主机进行批量安装、升级、卸载、启动、停止和重启插件的操作。 当前已对接的插件有:ICAgent。ICAgent插件为指标和日志采集插件。ICAgent插件采集据周期为1分钟,不支持修改。 批量管理ICAgent插件 登录AOM
Exporter,即可采集Linux类型主机节点的相关信息和运行指标,具体操作请参见配置弹性云服务器 ECS接入AOM。 配置弹性云服务器 ECS接入AOM Node Exporter是Prometheus官方提供的exporter,主要用来采集Linux类型节点的相关信息和运行指标,包括主机的CPU、内存
配置日志的统计方式。配置日志统计方式前,请按照界面指引先在采集配置中配置好ICAgent结构化解析规则,否则会无法在日志过滤和日志统计处选择到想要的日志字段。 在“指标预览”下方预览信息。该预览信息是基于用户配置的日志过滤和统计规则,在指定时间范围内,对日志流执行SQL查询模拟生成的指标结果。 指标预览依赖您先将
AOM将陆续支持其他各种类型插件的接入功能,您可以在安装了UniAgent的主机列表界面,直接对主机进行批量安装、升级、卸载、启动、停止和重启插件的操作。 当前已对接的插件有:ICAgent。ICAgent插件为指标和日志采集插件。ICAgent插件采集据周期为1分钟,不支持修改。 批量管理ICAgent插件 登录AOM
例如,手动刷新、1分钟等。 查看该Prometheus实例上报的基础指标和自定义指标数量。 自定义指标上报量:自定义指标的24H上报量和所选时间范围内累计上报量。 基础指标上报量:基础指标的24H上报量和所选时间范围内累计上报量。 自定义指标数量:所选时间范围内累计上报的自定义指标的种类。
产品架构 AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集
AOM告警规则中,资源项有时会出现数据不足的情况,如下图所示。 图1 查看规则状态 可能的原因如下: 数据上报延迟过大(曲线图最新数据上报时间和当前时间的时间差大于一个周期,阈值上报周期设定中可选1分钟和5分钟),上报周期内获取不到数据会报数据不足。 指标删除或指标所在的宿主已不存在,而阈值规则仍在,此时会报数据不足。
查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用率metric_name可以在主机指标中查看,集群ID和节点ID各自对应的name可以在
搜索日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志搜索”。 使用日志分析(新版)功能的区域可以通过表2中描述的入口进入“日志路径”页面。
关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。 精准告警 构建指标告警、事件告警、日志告警的统一告警体系,提供分组、抑制和静默等告警降噪策略,结合告警通知和订阅等功能,帮助用户从容应对海量告警风暴,快速检测和修复业务告警。
配额设置 指标配额可通过切换基础版(受限免费)和按需版(按需计费)来修改。 登录AOM控制台。 选择“配置管理 > 配额设置”。 查看指标配额。 图1 查看配额 当指标超过配额时,时间较早的指标将会被删除。 父主题: 配置管理
资源运行异常怎么办? 资源状态包括正常、亚健康、异常和通道静默。亚健康、异常或通道静默都可能导致资源运行异常,您可参考如下指导进行分析和修复。 亚健康 当有级别为次要或提示的告警时资源状态为亚健康。 修复建议:请在告警界面参考告警详细信息处理告警。 异常 当有级别为紧急或重要的告警时资源状态为异常。
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
删除接入规则或删除映射日志流不可恢复,请您谨慎操作。 重复映射 如果将同一个工作负载或文件映射分别映射到日志流A和B中,最新日志将同时上报至流A和流B,AOM会出现流A和流B重复的日志,同时重复产生的日志会被计费,因此不建议重复配置。 图5 重复映射 父主题: 接入LTS
功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来,提升运维操作的质量和效率,帮助企业运维转型和运维价值提升。 约束与限制 如需使用“自动
一键迁移 引导用户快速将仪表盘和告警规则数据从AOM 1.0一键迁移至AOM 2.0。 注意事项 告警规则一键迁移提供全量规则迁移和迁移结果查询的能力。 后台判断用户是否进行过迁移(迁移状态:未迁移,迁移中,迁移完成) 如果进行过迁移,显示迁移完成的弹框。 如果没有进行过迁移,显示一键迁移的弹框。
一键迁移AOM 1.0数据至AOM 2.0 引导用户快速将仪表盘和告警规则数据从AOM 1.0一键迁移至AOM 2.0。 迁移说明 告警规则一键迁移提供全量规则迁移和迁移结果查询的能力。 后台判断用户是否进行过迁移(迁移状态:未迁移,迁移中,迁移完成) 如果进行过迁移,显示迁移完成的弹框。