检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。 告警规则升级 告警规则升级后,告警规则相关数据从1.0平滑切换至2.0,并可自动适配AOM 2.0告警规则相关功能。 约束与限制 一键迁移告警规则至AOM 2.0时,迁移操作无法恢复,请谨慎操作。 日志升级
al I/O总耗时 node_disk_io_now 当前运行的I/O数量 node_context_switches_total 上下文切换次数 node_boot_time_seconds 节点开机时间 process_resident_memory_bytes 即RSS(Resident
应用场景 AOM应用广泛,下面介绍AOM的两个典型应用场景,以便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监
配置参数库 “参数库”页面展示现有所有参数信息,您可以在这里创建参数,也可以修改、删除已创建的参数。修改ECS非管理员密码,创建作业等多种场景下,可应用已创建的参数来快速设置用户密码、全局参数等信息。每个用户最多创建25个参数。 创建参数 登录AOM 2.0控制台。 在左侧导航栏
在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列中某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“拓扑”,切换至拓扑页签,即可查看所选组件的调用关系拓扑图。 您可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的拓扑图。可通过如下两种方式设置时间范围:
在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列中某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“Web容器”,切换至Web容器页签,默认展示“全部实例”的“Tomcat监控”信息,具体指标以及说明,参见表1。 图1 Web容器 表1 Tomcat监控参数说明列表
计费云服务:除Modelarts/IotDA/IEF/CSE以外,其它云服务接入Prometheus实例后均会产生计费。 ECS场景 在ECS场景自建中间件,会产生计费。 在ECS场景安装Node Exporter,部分指标会产生计费。 其它可能场景 除几类基础指标以外,其它指标上报到AOM均可能产生计费。
场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式统一,部分指标被
AOM集成Prometheus中间件插件,支持在Prometheus实例的“接入中心”为虚机安装中间件Exporter,将上报指标到指定的ECS Prometheus实例中。 当前仅ECS类型Prometheus实例支持。 云服务接入 AOM支持在Prometheus实例的“云服务接入”中将云服务接入A
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" , "key1" : "value1" // 创建告警规则时配置的告警标签
通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及
在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列中某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“通信协议”,切换至通信协议页签。默认展示“全部实例”的“Websocket监控”信息。 Websocket监控具体指标以及说明,参见表1。 图1 查看通信协议
在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列中某一个组件名称,进入该组件详情页。默认展示“接口调用”详细信息。 单击“异常”,切换至异常页签。页面默认展示所“全部实例”的“异常日志”异常日志信息,具体指标以及说明,请参见表1。 图1 异常 表1 异常日志参数说明列表 指标集
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" , "key1" : "value1" // 创建告警规则时配置的告警标签
按集群维度查看当前集群的节点、工作负载、Pod(容器组)和容器信息。 在左侧导航栏选择“洞察 > 节点”,可实时获取到该集群下查看该集群所有主机节点的概况,包括状态、IP地址、Pod状态、CPU使用率和内存使用率等信息。 在节点列表上方,可按节点名称设置过滤条件,实现节点列表过滤显示。 单击右上角的,通过选
州区域的菜单路径为“仪表盘 > 仪表盘”。如果您需要使用新版仪表盘功能,在左侧导航栏中选择“仪表盘”后,还需要单击页面右上角“体验新版”,切换至新版仪表盘界面。 选择待操作的仪表盘,在对应“仪表盘”页面右上角单击。 在弹出的对话框中设置全屏模式在线时长。具体的参数说明请参见表1。
坐标轴距离图表上边界距离。 下边距 坐标轴距离图表下边界距离。 左边距 坐标轴距离图表左边界距离。 右边距 坐标轴距离图表右边界距离。 Tooltip配置 排序方式 提示框配置,当Y轴数据选择多个时,可对其进行排序显示。 X轴 显示X轴 开启后,显示X轴数据。 X轴名称 设置X轴名称。 Y轴
将光标移动到指标数据和对应告警条件后,还可以根据需要执行以下操作: 单击告警条件后的,可将对应行的指标数据在当前图表中隐藏。 单击告警条件后的,可将对应行的指标数据和告警条件转换为Prometheus命令。 单击告警条件后的,可快速复制对应行的指标数据及告警条件等信息,并根据需要修改。 单击告警条件后的,可删除对应行指标数据的监控。
选择某一组件,在右侧区域查看当前组件的告警分析信息。 单击告警名,查看当前告警的详细信息,详情请参见查看AOM告警或事件。 单击右上角下拉框可选择展示“活动告警”或切换为“历史告警”。 选择某一环境,在右侧区域查看当前环境信息、进程信息、性能、日志分析、调用链以及告警信息。 图5 查看环境 在“环境概览”
坐标轴距离图表上边界距离。 下边距 坐标轴距离图表下边界距离。 左边距 坐标轴距离图表左边界距离。 右边距 坐标轴距离图表右边界距离。 Tooltip配置 排序方式 提示框配置,当Y轴数据选择多个时,可对其按照不排序、升序、降序进行排序显示。 X轴 显示X轴 开启后,显示X轴数据。 X轴名称