检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Prometheus监控 基础设施监控 应用监控 常见问题 了解更多常见问题、案例和解决方案 常见使用问题 如何区分告警和事件? 怎样查看AOM中的日志是通过哪个应用产生的? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? ICAgent和UniAgent是同一个插件吗?
告警管理 如何区分告警和事件?
述和操作指导,帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 通过多账号聚合Prometheus实例实现指标数据统一监控
0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。 在左侧导航栏选择“采集设置 > UniAgent 安装与配置”。当前仅华南-广州区域的菜单路径为“采集设置 > UniAgent管理”。
其他常见问题 AOM 1.0与AOM 2.0使用对比 AOM与APM有何区别? AOM的日志服务与LTS的日志服务有何区别? 如何创建委托apm_admin_trust?
0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。 在左侧导航栏选择“采集设置 > UniAgent 安装与配置”。当前仅华南-广州区域的菜单路径为“采集设置 > UniAgent管理”。
None 操作指导 应用运维管理 AOM 如何创建告警规则 04:10 创建告警规则
告警的XX参数的值。例如设置为:资源类型+正则+host*,表示筛选出metedata字段中资源类型的值包含host字样的告警。 设置规则说明: 分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每个并行条件下可设置一个或多个告警行动规则。 多个串行条件之
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。
登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。 在左侧导航栏中选择“采集设置 > CCE接入”。当前仅华南-广州区域的菜单路径为“采集设置 > CCE集群管理”。 查看已接入的CCE集群。
在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。 在左侧导航栏中,选择“采集设置 > 操作日志 > UniAgent操作日志”。当前仅华南-广州区域的菜单路径为“采集设置 > 操作日志”。 设置搜索条件,搜索满足搜索条件的历史任务。
在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。 在左侧导航栏中,选择“采集设置 > 操作日志 > UniAgent操作日志”。当前仅华南-广州区域的菜单路径为“采集设置 > 操作日志”。 设置搜索条件,搜索满足搜索条件的历史任务。
登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。 在左侧导航栏中选择“采集设置 > CCE接入”。当前仅华南-广州区域的菜单路径为“采集设置 > CCE集群管理”。 查看已接入的CCE集群。
接入云服务前,需要先为云服务选择所属的企业项目。如果事先已在全局页面选择具体的企业项目,此处无需再设置。如果在全局页面设置为“全部企业项目”,请从下拉列表中选择。 图1 查看云服务信息 在云服务实例列表右上角可设置筛选条件或按实例名称、ID等设置搜索条件,实现云服务实例过滤显示。 单击右上角的,可实时获取到该云服务全部实例的最新信息。
表示紧急告警。 :表示重要告警。 :表示次要告警。 :表示提示告警。 单击“高级设置”,设置检查频率、告警恢复等信息,具体参数说明请参见表5。 表5 “高级设置”填写说明 参数名称 参数说明 示例 检查频率 根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。
测;如果探测到符合的进程,将可进入下一步的操作,否则不能进入后续操作。 设置应用名称及组件名称。 设置应用名称。 设置应用名称。 在“应用名称设置”下单击“添加命名项”,为已发现的进程设置应用名。 若您未设置应用名,则应用名默认为unknownapplicationname。 当
设置告警规则详情。具体的参数说明如表6所示。 设置完成后,监控的指标数据以折线图形式显示在告警条件上方。单击“新增指标”可多次添加监控指标,并为指标设置统计周期和检测规则等信息。 图2 设置告警规则详情 表6 告警规则详情填写说明 参数名称 参数说明 示例 多指标 按设置的多个指标数据和对应告警条件逐条计算,只要满足一个条件则触发告警。
待静默的告警通知需符合的条件,即满足该条件的告警通知均会被屏蔽。 静默条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 若串行条件设置为“告警级别等于紧急”,则符合告警级别为紧急的告警通知会被屏蔽。
参数名称 说明 - 排序方式 设置数据的排序方式,默认为降序。 限制数量 设置TopN图表中显示的条形图数量,默认为5个。 展示维度 设置TopN图表中展示的指标维度。 柱宽 设置柱宽度,可选择auto、16、22、32、48、60,默认展示auto。 单位 设置展示数据的单位,默认单位为“%”。