检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM支持为主机、组件等多种资源的指标设置阈值告警,具体支持的指标类型可在创建阈值告警规则的页面查看。 更多指标介绍可参见指标总览。 创建方式 阈值告警规则的创建方式分为两种:自定义阈值规则和使用模板
http://{集群任意节点的公网IP}:30433/metrics,即可通过自定义的queries.yaml查询到Postgres实例启动时间指标。 图1 访问地址 添加采集任务 通过新增PodMonitor方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。
http://{集群任意节点的公网IP}:30433/metrics,即可通过自定义的queries.yaml查询到Postgres实例启动时间指标。 图1 访问地址 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。
资源检索 资源检索提供应用、主机等资源的检索功能,支持通过ID、关键字、名称等方式快速检索资源。 图1 资源检索 搜索条件只允许输入2~124字符。 允许输入多个ID、关键字或名称搜索,多个搜索条件之间请用“,”间隔。例如搜索名称包含“AOM”和“LTS”的应用或资源,可在搜索框输入“aom
先获取Grafana视图的普罗语句,然后在AOM中通过“按普罗语句添加”方式创建仪表盘图表。 具体操作如下: 登录Grafana并获取Grafana视图的普罗语句。 登录AOM 2.0控制台。 在左侧导航栏中选择“ 指标浏览”。 从下拉列表选择需要监控的Prometheus实例。
批量卸载:此操作适用于正常安装ICAgent后需批量卸载的场景。 服务器上的ICAgent被卸载后,会影响该服务器的运维能力,导致AOM无法采集到客户相关的指标信息,请谨慎操作。 通过界面卸载 在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右侧的下拉列表框中选择“其他: 用户自定义接入主机”。
您可以根据自己的需求任意组合,以空格分隔,字符长度不能超过250。 脚本参数 默认脚本参数中的参数。输入默认脚本参数后,会根据默认脚本参数中的脚本参数自动识别脚本参数。 脚本参数的参数信息如下: 必填:开启该按钮,插件调试中的参数值为必填项;关闭该按钮,插件调试中的参数值可不填写。
资源检索 提供应用、主机等资源的检索功能,支持通过ID、关键字、名称等方式快速检索资源。 不支持 支持 应用管理 管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+ 组件 + 环境”的应用管理模型。 资源管理 全局查看所有的云服务资源对象与应用的关联关系,便于用户对资源进行分析和管理。
例如:error*,帮助搜索。 短语精确搜索 针对日志中的短语进行精确搜索,大小写敏感。 && 搜索结果的交集。 || 搜索结果的并集。 AND 搜索结果的交集。 OR 搜索结果的并集。 NOT 搜索结果不包含NOT后的关键字。 ? 模糊搜索能力,?放在关键字中间或末尾,用于替代一个字符。
填写规则的描述信息。 图1 设置告警基本信息 设置告警规则的详细信息。 设置“规则类型”为“事件类告警”。 设置告警来源、触发对象和触发策略。 表1 告警规则填写说明 参数名称 填写说明 告警来源 事件类告警来源的服务名称,从现有的服务列表中选择。 触发对象 服务事件的筛选条件。
如果显示数据采集被停止,可能的原因有: 实例级别停止,APM探针管理中采集被停止。 监控项级别停止,监控项状态列表某些监控项采集被人为停止。 APM控制台的“全局配置(系统管理 > 通用配置)”中字节码方式采集被停止。 如果长时间未采集到指标数据,可能的原因有: java9启动提示找不到sql
示项后的复选框,自定义列表项的展示/隐藏。 在页面右上角单击,根据需要在下拉列表中设置组件信息的统计条件。 设置时间范围,查看已设时间范围内组件。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近30分钟、近1小时等,可根据实际需要选择不同的时间粒度。
到OBS桶中,以便进行长期存储。 日志数据的相关费用统一由LTS提供并上报话单,AOM不会双算。 指标数据:通过数据订阅功能,将指标数据转发到用户配置的DMS或Webhook的Topic中存储。
去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 分组、抑制、静默需手动创建规则,具体的创建方式请参见创建分组规则、创建抑制规则和创建静默规则。 图1 告警降噪流程图 此模块只作用于消息通知部分,所有触发的告警和事件都可在“告警列表”页面查看。 告警降
操作。 告警合并规则 通知合并方式 根据指定字段对分组后的告警合并 。合并在一组的告警会被汇聚在一起发送一条通知。 合并方式包括: 按告警源:由相同告警源触发的告警,合并为一组发送告警通知。 按告警源 + 严重度:由相同告警源触发的告警,且其严重度相同时,合并为一组发送告警通知。
如果要通过终端节点的方式打通AOM/LTS的网络,需要为AOM和LTS各自购买1个终端节点。 创建AOM/LTS终端节点的方法: 登录华为云VPC终端节点 VPCEP控制台,进入终端节点页面。 单击“购买终端节点”。 在购买终端节点页面,选择终端节点所在的区域,“服务类别”选择
规则名称 分组规则的名称。名称只能由大小写字母、数字、下划线组成,且不能以下划线开头和结尾,最多不能超过100个字符。 描述 分组规则的描述。最多不能超过1024个字符。 告警分组规则 分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。
下画出来的柱状图,每一个分类数据被圆弧平分,使用圆弧的半径长短表示数据的大小,相比于饼图来说有如下优点: 饼图适用于不超过10条的分类数据,南丁格尔玫瑰图则适用于分类较多的场景(10-30条数据)。 由于半径和面积是成平方的关系,南丁格尔玫瑰图放大了各个分类数据之间值的差异,尤其适合对比大小相近的数值。
下画出来的柱状图,每一个分类数据被圆弧平分,使用圆弧的半径长短表示数据的大小,相比于饼图来说有如下优点: 饼图适用于不超过10条的分类数据,南丁格尔玫瑰图则适用于分类较多的场景(10-30条数据)。 由于半径和面积是成平方的关系,南丁格尔玫瑰图放大了各个分类数据之间值的差异,尤其适合对比大小相近的数值。
操作 说明 创建任务 单击卡片或单击卡片右上角的并选择“创建任务”。 下架卡片 单击卡片右上角的并选择“下架”,下架后服务场景页面将不展示该卡片。下架服务卡片后,原子服务场景关联的原子任务不能再次被执行,待该原子场景被重新上架后,关联的原子任务恢复执行功能。 服务下架时,需确认服务