检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用是根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。通过应用监控您可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。 功能介绍 应用监控基于应用资源管理对资源实行从应用、业务组件、到环境的分层监控,每一层对应的观测指标均不同。 应用层监控 在应用层,主要监控业务层
在“日志搜索”页面中选择日志页签(即组件、系统、主机)并按照界面提示设置日志查询条件。 支持分别搜索“组件”、“系统”、“主机”日志。 组件日志支持设置“集群”、“命名空间”、“组件”等过滤条件,还可以通过“高级搜索”,设置“实例”、“主机”、“文件名称”、“隐藏系统组件”等过滤条件搜索日志。 系统日志支持设置“集群”、“主机”等过滤条件。
主要监控用户通过应用资源管理功能统一管理的所有资源对象与应用,通过该应用监控可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。 入口为:“进程监控 > 应用监控” 主要监控通过应用发现规则发现的进程对应的应用。 父主题: 应用监控
要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签特征 告警标签可应用于告警降噪模块的分组规则、抑制规则和静默规则,告警管理系统根据标签属性进行告警管理和通知。 告警标签为key:value键值对格式,支持用户自定义。key 和value只能由字母、数字和下划线组成
概述 AOM提供告警行动规则定制功能,当资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 通过创建告警行动规则关联SMN主题与消息模板。 通过创建消息模板,自定义通知消息配置。 告警行动规则创建成功后,可在“告警> 告警降噪> 分组规则”中“创建分组规则”关联行动规则。
如果显示数据采集被停止,可能的原因有: 实例级别停止,APM探针管理中采集被停止。 监控项级别停止,监控项状态列表某些监控项采集被人为停止。 APM控制台的“全局配置(系统管理 > 通用配置)”中字节码方式采集被停止。 如果长时间未采集到指标数据,可能的原因有: java9启动提示找不到sql.time类 原因分析:APM探针开发环境为jdk1
降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 实践场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,需要从众多告警中快速及时发现故障,全面掌握应用。 解决方案 AOM通过设置告警规则,实时监控环境中主机
子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并,合并后的告警可以关联行动规则,触发告警通知。
时间的描述格式由rfc822定义。 Mon,12 Nov 2007 15:55:01 GMT Server HTTP协议标准报头。包含了服务器用来处理请求的软件信息。 Apache Content-Length HTTP协议标准报头。用于指明实体正文的长度,以字节方式存储的十进制数字来表示。
remote_write_url String Prometheus实例remote-write地址。 remote_read_url String Prometheus实例remote-read地址。 prom_http_api_endpoint String Prometheus实例调用url。
停止计费 对于以按需计费模式使用的AOM 2.0资源,相关指标和日志数据从上报之日起,在AOM 2.0上会自动存储一个月,一个月后系统自动删除数据,删除后相关数据将停止计费。如果用户需要继续使用相关指标和日志数据,建议采用以下方式存储: 日志数据:通过日志转储功能,将日志数据转储到OBS桶中,以便进行长期存储。
行动规则类型 行动规则的类型,请从下拉列表中选择。 指标或事件 当指标或事件满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 日志 当日志数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 行动方式 告警行动规则与SMN主题、消息模板关联
管理Prometheus实例 配置预聚合规则 指标管理 仪表盘监控 数据多写 接入指南 获取Prometheus实例的服务地址 Prometheus实例读写地址支持公网的局点 通过Grafana查看Prometheus实例数据 通过Remote Read方式读取Prometheus实例数据
> 接入中心”。 在“Prometheus 运行环境”面板单击“ECS Node Exporter”卡片。 “ECS Node Exporter”卡片当前仅华北-北京四卡片改名为“弹性云服务器 ECS”。 在“ECS Node Exporter”弹框中的“安装步骤”页签,按照页面提示进行安装。
修改ECS非管理员密码 使用修改ECS非管理员密码卡片可以修改非管理员用户的密码。 前提条件 ECS实例均已成功安装UniAgent,并且UniAgent的状态为运行中。 创建修改ECS非管理员密码任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。
网络管理”,在Service页面获取Grafana服务的访问地址和端口,以及Prometheus服务的访问域名和端口。 左侧导航栏选择“配置中心 > 配置项”,在配置项页面找到grafana-conf配置项,单击“编辑YAML”,将"root_url"修改成Grafana的访问地址。 在配置项页面找到grafa
子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并,合并后的告警可以关联行动规则,触发告警通知。
服务已接入可观测Prometheus 监控。具体操作请参见: Prometheus实例 for 云服务 Prometheus实例 for ECS Prometheus实例 for CCE Prometheus 通用实例 Prometheus实例 for 多账号聚合实例 Remote
不能超过64个字符。 订阅内容 选择“webhook”。 自建普罗 Remote Write地址 请输入用户侧Prometheus实例的Remote Write地址,作为指标发送的目标地址。 传输请求的协议,请根据实际情况从下拉列表中选择,推荐使用HTTPS协议。 数据类型 默认为“指标”。
平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。同时,AOM开放统一API,支撑对接自研监控系统或者报表系统。AOM并非传统