检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
立即使用 成长地图 由浅入深,带您玩转AOM 01 了解 AOM是云上应用的一站式立体化运维管理平台。 产品介绍 什么是AOM 应用场景 与其他服务的关系 约束与限制 指标总览 基本概念 03 入门 快速了解AOM服务在不同应用场景中的操作流程。 快速入门 监控云容器引擎 CCE的指标
0控制台,在左侧导航栏中选择“设置”,进入“全局配置”界面。 在左侧导航栏中,选择“UniAgent安装与配置”,选择待安装ICAgent的主机,单击“插件批量操作”。 在弹出的对话框中,操作类型选择“安装”,选择插件为“ICAgent”,插件版本选择“5.12.163”,在“ak”、“sk”中输入1获取的AK/SK。
您在主机上部署应用后,在主机上安装的ICAgent将自动收集应用信息,包括进程名称,组件名称,容器名称,Kubernetes pod名称等,自动发现的应用在界面上以图形化方式展示,支持您自定义别名和分组对资源进行管理。 仪表盘 通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形
最多可查看最近7天内的桶日志。 查看桶日志 登录AOM控制台,在左侧导航栏中选择“日志 > 日志桶”,在“桶日志”页签查看桶日志。 设置查询条件。 选择日志桶:在左上方的下拉列表框中选择目标日志桶。 设置查询的时间范围:在右上方的下拉列表框中可选择“近30分钟”、“近1小时”或“近
为“已结束”。 事件总览 在“智能洞察(BETA)”主页面,默认以柱状图形式展示近30分钟的所有事件。您可以根据需要调整时间范围,查看近1小时、近6小时、近1天、近1周或自定义时间段的事件。 图2 事件统计视图 在事件统计图区域,还可以执行以下操作: 在图表左上角,查看设置的时间段内事件巡检检测到的异常事件总数。
OM。 表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 通过多账号聚合Prometheus实例实现指标数据统一监控
监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控 > 实例列表”。 在Prometheus实例列表中,单击CCE类型的Prometheus实例名称,进入该实例的详情界面。 在左侧导航栏单击“指标管理”,在“配置”页签下单击“PodMonitor”。
监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控 > 实例列表”。 在Prometheus实例列表中,单击CCE类型的Prometheus实例名称,进入该实例的详情界面。 在左侧导航栏单击“指标管理”,在“配置”页签下单击“PodMonitor”。
由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。
监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控 > 实例列表”。 在Prometheus实例列表中,单击CCE类型的Prometheus实例名称,进入该实例的详情界面。 在左侧导航栏单击“指标管理”,在“配置”页签下单击“PodMonitor”。
监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控 > 实例列表”。 在Prometheus实例列表中,单击CCE类型的Prometheus实例名称,进入该实例的详情界面。 在左侧导航栏单击“指标管理”,在“配置”页签下单击“PodMonitor”。
可在左侧导航栏中选择“告警管理 > 告警列表”,在“事件”页签下查看该事件,具体请参见“查看事件”。 管理日志告警规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警规则”。 在右侧区域选择“日志”页签。 在规则列表中查看已创建的所有告警规则,并可根据需要执行以下操作,具体请参见表
义指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。 配置仪表盘图表 登录AOM 2.0控制台。 在左侧菜单栏中选择“仪表盘”,单击“创建仪表盘”新建一个仪表盘,详情可参见创建仪表盘。 在仪表盘页面选择实例类型为“Prometheus
义指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。 配置仪表盘图表 登录AOM 2.0控制台。 在左侧菜单栏中选择“仪表盘”,单击“创建仪表盘”新建一个仪表盘,详情可参见创建仪表盘。 在仪表盘页面选择实例类型为“Prometheus
骤进行安装。 安装完成后,在UniAgent列表中可查看。 远程安装 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 左侧导航栏中,选择“采集设置 > UniAgent 安装与配置”,单击右上角“安装UniAgent”。 在安装UniAgent页面中,
的开始时间和结束时间对应不同配置在该小时内的生效时间。 例如,您在9:00:00设置指标上报的Prometheus实例为“Prometheus_A”,在9:30:00变更设置指标上报的Prometheus实例为“Prometheus_B”,那么在9:00:00 ~ 10:00:00间会产生两条计费信息。
遵循开源Prometheus的数据模型。一条采样点数据包含指标名称、Label集合、采样时间时间戳及取值这几个部分,采样点以时间线的方式在逻辑上组织起来。例如,kube_node_status_allocatable_cpu_cores指标监控了Kubernetes集群中每个节点
搜索分析创建、按SQL统计创建。 按搜索分析创建日志告警规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警规则”。 在右侧区域选择“日志”页签,然后单击“创建”。 在“创建日志告警规则”页面,配置告警规则相关参数,具体参数说明如所示表 告警条件填写说明。 表1
当前仅在华东-上海一创建应用性能告警规则时,支持设置此参数。 置入变量:鼠标悬浮在“变量预览”下的变量上,单击“置入”,可以在“通知模板”中插入变量。 复制变量:鼠标悬浮在“变量预览”下的变量上,单击“复制”,可以复制变量名称。 查看预制变量:系统提供变量模板,详情请见表5。 表5 变量模板
登录ECS主机,在主机中以root权限执行4复制的Linux安装命令进行安装。 安装完成后,在UniAgent列表中查看UniAgent安装状态。UniAgent状态为运行中,则安装成功。 创建主机组 支持创建IP类型与自定义标识类型主机组,此处选择创建IP类型主机组。 在左侧导航栏选择“设置