检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 例如,串行条件设置为“告警级别等于提示”,则符合告警级别为提示的告警通知会被屏蔽。 静默时间 告警通知被屏蔽的时间,包含以下两种: 固定时间:仅在指定的时间段执行屏蔽告警通知的操作。
UniAgent和ICAgent安装类常见问题 UniAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 UniAgent安装成功后,后续的心跳和注册都失败,代理机网络不通,如何解决?
CCI”卡片,可查看支持接入的CCI指标。上报到AOM的CCI指标,详细说明请参见基础指标-虚机指标。 弹性云服务器 ECS 单击“弹性云服务器 ECS”卡片,在弹框中安装Prometheus官方提供的Node Exporter,即可采集Linux类型主机节点的相关信息和运行指标,具体操作请参见配置弹性云服务器
查询时间序列 场景描述 本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用
查看更详细的数据。 在华东-上海一区域查看告警时支持以下功能: 告警源为LTS的告警:单击告警详情页中日志组、日志流、关键词、查询语句可跳转到具体详情页面,查看更详细的数据。 关联CCE类型Prometheus实例的告警规则触发的告警:单击告警详情页中涉及容器相关资源的clust
单击右上角的,通过选中或取消选中各展示项后的单选框,自定义可选列的展示与隐藏。 单击容器名称,可查看容器的相关资源、告警、事件和仪表盘信息。在“相关资源”页签下,默认展示该容器所在的容器组。可按节点和节点名称、工作负载和负载名称、容器组和容器组名称查看当前容器相关的节点、工作负载、容器组信息。
规则名称 分组规则的名称。名称只能由大小写字母、数字、下划线组成,且不能以下划线开头和结尾,最多不能超过100个字符。 描述 分组规则的描述。最多不能超过1024个字符。 告警分组规则 分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态。单击组
告警规则”。 选中一个或多个告警规则前的复选框,在规则列表上方单击“一键迁移至AOM2.0”。 在弹出的“迁移规则”对话框中单击“确定”,即可将选中的告警规则批量迁移至AOM 2.0。 如果待迁移的告警规则依赖告警模板,告警规则迁移时,对应的告警模板会同步迁移。 父主题: 迁移AOM
告警规则”。 选中一个或多个告警规则前的复选框,在规则列表上方单击“一键迁移至AOM2.0”。 迁移操作无法恢复,请谨慎操作。 如果待迁移的告警规则依赖告警模板,告警规则迁移时,对应的告警模板会同步迁移。 在弹出的“迁移规则”对话框中单击“确定”,即可将选中的告警规则批量迁移至AOM 2.0。
应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。应用的类型包括系统应用和自定义应用。应用的类型包括系统应用和自定义应用,通过内置发现规则发现的是系统应用,通过自定义规则发现的是自定义应用。 在AOM的应用发现界面配置应用发现规则,可自动发现符合规则的应用并监控相关指标,详情请参考配置应用发现规则。
AOM告警规则中,资源项有时会出现数据不足的情况,如下图所示。 图1 查看规则状态 可能的原因如下: 数据上报延迟过大(曲线图最新数据上报时间和当前时间的时间差大于一个周期,阈值上报周期设定中可选1分钟和5分钟),上报周期内获取不到数据会报数据不足。 指标删除或指标所在的宿主已不存在,而阈值规则仍在,此时会报数据不足。
指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集器)并通过ICAgent上报相关的运维数据。 API接入数据
若该日志之前已打印的日志条数 ≥100,该日志之后已打印的日志条数 ≥99,则该日志之前的100条和之后的99条日志会被作为上下文显示。 若该日志之前已打印的日志条数 <100(例如,已打印90条日志),该日志之后已打印的日志条数 <99(例如,已打印80条日志),则该日志之前的90条和之后的80条日志会被作为上下文显示。
搜索日志流中的日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,还可通过分析日志的来源信息和上下文原始数据快速定位问题。 约束与限制 如需使用“日志流”功能,需提前在“菜单开关”中开启日志流的开关,详细操作请参见菜单开关。 使用日志分析(新版)功能的区域没有日志流功能。
告警抑制规则功能可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
在左侧导航栏中选择“资源分组”,可查看资源分组的信息。 也可在右侧的搜索框中,输入“资源名称”,可搜索资源分组。 编辑资源分组 在左侧导航栏中选择“资源分组”,可查看资源分组的信息。 在资源分组名称后的操作列,单击“修改”。 在弹出的窗口,修改资源信息后,单击“确定”,修改资源信息。
供日志搜索、结构化和可视化等功能。通过添加接入规则,可以将AOM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。 什么是映射 AOM中的日志实际上是以一个日志流的形式在LTS中存在(如图1中的AOM日志流所示),