正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
时,通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创建的告警规则数量不能超过1000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 告警规则(新版)
务设置事件条件,对资源的指标设置阈值条件,或对资源的日志设置搜索分析、关键词统计以及SQL查询等条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。当资源的日志数据满足设置的告警条件,产生日志告警。
您可以通过AOM的监控功能监控资源的使用情况,评估当前配置是否过高。例如:CPU、内存、带宽等资源的利用率。寻找节约成本的机会。也可以根据成本分析阶段的分析结果识别成本偏高的资源,然后采取针对性的优化措施。
需要监控的指标。单击“指标”文本框,通过下列框右侧的资源树,可以按资源类型快速选择需监控的指标。 aom_container_cpu_usage 统计周期 指标数据按照所设置的统计周期进行聚合。 1分钟 条件 指标监控的维度。不设置则表示选中全部资源。此处根据3中监控的工作负载设置条件。
检查内网域名配置 由于上述配置中的数据上报是通过内网进行数据传输,因此需要确保您的Prometheus所在的主机能够解析内网域名,请参考配置内网DNS。 重新启动Prometheus。 可通过通过grafana查看AOM中的指标数据中grafana查询指标数据的方法,来验证上述配置修改后数据上报是否成功。
通过grafana查看AOM中的指标数据 前提条件 已购买弹性云服务器ECS,具体操作请参见《弹性云服务器快速入门》。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。 操作步骤 安装并启动Grafana,具体操作请参见Grafana官方文档。
应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。 应用: 一个完整的业务模块,由多个组件组成。
操作 说明 创建任务 单击卡片或单击卡片右上角的并选择“创建任务”。 下架卡片 单击卡片右上角的并选择“下架”,下架后服务场景页面将不展示该卡片。下架服务卡片后,原子服务场景关联的原子任务不能再次被执行,待该原子场景被重新上架后,关联的原子任务恢复执行功能。 服务下架时,需确认服务
单击右上角的,可获取到设置的时间范围内进程的最新信息。 在CCE主机的“Pod实例”页签下,可查看实例状态、节点IP等信息。 单击实例名称,可逐层下钻查看该实例的容器、进程的详细信息。 在实例列表右上角的搜索框可按实例名称等设置搜索条件,实现实例过滤显示。 单击右上角的,可获取到设置的时间范围内实例的最新信息。
应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则发现主机上的应用,并呈现在“应用监控”界面。
应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则发现主机上的应用,并呈现在“应用监控”界面。
下操作: 增加别名 当组件名称比较复杂,不便于识别时,可为该组件增加一个便于识别的别名。 在组件列表中,单击组件所在行“操作”列下的,输入别名,再单击“确定”,别名添加成功。添加的别名只允许修改,不允许删除。 添加标签 标签是组件的标识,通过标签您可区分系统组件和非系统组件。AO
在规则列表中可查看已创建的接入规则的集群名称、命名空间等信息。单击搜索框右上方的,自定义列表项的展示。单击“接入日志组”列的日志组名称,可以跳转到LTS控制台的日志组详情。 编辑 单击“操作”列的“编辑”,可以编辑该接入规则。修改接入规则的影响请参见修改映射。 删除 单击“操作”列的“删除”,
指标、告警、配置等数据以多副本方式存储,保障数据可靠性。 / 数据订阅 AOM支持客户配置数据订阅,把客户的指标和告警数据发送到客户指定的DMS实例中,客户可以自由处理转储出来的这部分数据。 数据订阅 父主题: 安全
Management)是云上应用的一站式立体化运维管理平台,实时监控用户的应用及相关云资源,采集并关联资源的各项指标、日志及事件等数据共同分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。 AOM作为云上应用的一站式立体化运维管
件监控”的主操作界面。 在“实例列表”页签,可查看该组件所有实例的概况。 单击实例名称,可监控业务进程或组件pod的资源占用与健康状态。 在“主机列表”页签,可查看该组件所在的主机概况。 在“告警分析”页签,可查看该组件的告警情况。 单击“监控视图”页签,可监控该组件的各种指标。
文件包名称,下拉列中选择文件包名称。下拉框只展示上线的文件包名称,未上线文件包名称不显示。 版本号 软件版本信息,根据选定的文件包名称自动获取。 操作类型 操作类型,包括安装和卸载两种类型。 目标存储路径 可通过${var_name}方式引用全局变量的字符串参数。 文件来源 回填所选的文件包版本中的文件来源,参见表1。
在指定主机页面,可通过右上角,取消已勾选的主机。 选择的主机必须是UniAgent状态为运行中的主机,否则创建的采集任务无法采集数据。 说明: 当采集插件为中间件插件时,只能选择一个主机。 指标维度 当“采集插件”选择“中间件”时,会显示该插件的默认指标项。 单击按钮,选择“内置指标
在指定主机页面,可通过右上角,取消已勾选的主机。 选择的主机必须是UniAgent状态为运行中的主机,否则创建的采集任务无法采集数据。 说明: 当采集插件为中间件插件时,只能选择一个主机。 指标维度 当“采集插件”选择“中间件”时,会显示该插件的默认指标项。 单击按钮,选择“内置指标
在指定主机页面,可通过右上角,取消已勾选的主机。 选择的主机必须是UniAgent状态为运行中的主机,否则创建的采集任务无法采集数据。 说明: 当采集插件为中间件插件时,只能选择一个主机。 指标维度 当“采集插件”选择“中间件”时,会显示该插件的默认指标项。 单击按钮,选择“内置指标