检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列中某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“消息队列”,切换至消息队列页签。默认展示“全部实例”的“KafkaProducer监控”信息。 图1 查看消息队列 在下拉列表中选择您想要查看的“实例名称
云服务场景 云服务场景展现启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载已上架的工具卡片。可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作,具体操作参见启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。
技术栈”。 单击“组件”列中某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“Debugging诊断(Beta)”,切换至Debugging诊断页签。默认展示“线程分析”页面。 单击“方法分析”,进入方法分析页签。 输入类名称并选择方法名,单击“确认”,页面将显示该方法某次执行的具体信息。
应用场景 AOM应用广泛,下面介绍AOM的两个典型应用场景,以便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监
支持按规则名称等信息搜索,可在右上角的搜索框中输入关键字,单击后显示匹配对象。 查看告警规则详细信息 单击规则名称前的,可查看该告警规则的详细信息,包括每个规则的基本信息、告警条件等。指标告警规则还可查看监控对象及触发的告警列表信息。 查看告警 在已设的连续周期内,当某个资源的指标数据满足阈值条件时,产生一条阈值告警。
配置参数库 “参数库”页面展示现有所有参数信息,您可以在这里创建参数,也可以修改、删除已创建的参数。修改ECS非管理员密码,创建作业等多种场景下,可应用已创建的参数来快速设置用户密码、全局参数等信息。每个用户最多创建25个参数。 创建参数 登录AOM 2.0控制台。 在左侧导航栏
计费云服务:除Modelarts/IotDA/IEF/CSE以外,其它云服务接入Prometheus实例后均会产生计费。 ECS场景 在ECS场景自建中间件,会产生计费。 在ECS场景安装Node Exporter,部分指标会产生计费。 其它可能场景 除几类基础指标以外,其它指标上报到AOM均可能产生计费。
采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。 告警规则升级 告警规则升级后,告警规则相关数据从1.0平滑切换至2.0,并可自动适配AOM 2.0告警规则相关功能。 日志升级 登录AOM 2.0控制台。 升级容器日志和虚机日志: 升级容器日志:单击
采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。 告警规则升级 告警规则升级后,告警规则相关数据从1.0平滑切换至2.0,并可自动适配AOM 2.0告警规则相关功能。 约束与限制 一键迁移告警规则至AOM 2.0时,迁移操作无法恢复,请谨慎操作。 日志升级
al I/O总耗时 node_disk_io_now 当前运行的I/O数量 node_context_switches_total 上下文切换次数 node_boot_time_seconds 节点开机时间 process_resident_memory_bytes 即RSS(Resident
在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列中某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“拓扑”,切换至拓扑页签,即可查看所选组件的调用关系拓扑图。 您可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的拓扑图。可通过如下两种方式设置时间范围:
在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列中某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“Web容器”,切换至Web容器页签,默认展示“全部实例”的“Tomcat监控”信息,具体指标以及说明,参见表1。 图1 Web容器 表1 Tomcat监控参数说明列表
点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 > 告警降噪”。 在“抑制规则”页签下单击
场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式统一,部分指标被
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" , "key1" : "value1" // 创建告警规则时配置的告警标签
AOM集成Prometheus中间件插件,支持在Prometheus实例的“接入中心”为虚机安装中间件Exporter,将上报指标到指定的ECS Prometheus实例中。 当前仅ECS类型Prometheus实例支持。 云服务接入 AOM支持在Prometheus实例的“云服务接入”中将云服务接入A
简介 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS
通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" , "key1" : "value1" // 创建告警规则时配置的告警标签
在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列中某一个组件名称,进入该组件详情页。默认展示“接口调用”详细信息。 单击“异常”,切换至异常页签。页面默认展示所“全部实例”的“异常日志”异常日志信息,具体指标以及说明,请参见表1。 图1 异常 表1 异常日志参数说明列表 指标集