检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 图1 告警降噪流程图 分组、抑制、静默需手动创建规则,创建方式见下方文档说明。 此模块只作用于消息通知部分,所有触发的告警和事件都可在告警、事件页面查看。 告警降噪中所有的规则条件均取自告警结构体中的"metadata"字段
AOM提供基础设施监控功能,可以对工作负载、集群、主机、进程与云服务进行监控。通过工作负载监控您可以及时了解工作负载的资源使用、状态和告警等信息;提供集群监控可实时监控集群的多项基础监控指标和相关的告警、事件数据;通过主机监控您可以及时了解主机的资源使用情况、趋势和告警信息;通过进程监控您可以配置规则
Exporter插件即可采集主机的相关指标。Node Exporter采集的具体指标请参见:基础指标-node-exporter指标。采集周期默认为60s,超时时间默认为60s,不可修改。 您还可以在“弹性云服务器 ECS”弹框中的“采集任务”页签对相关采集任务执行如下的操作。 表2 相关操作
应用资源管理使用限制 限制项 说明 应用数量 租户创建的应用个数最多不超过1000。 子应用数量 应用下创建的子应用数量最多不超过50。 组件数量 子应用下的创建的组件数量最多不超过50。 环境数量 组件下可创建的环境数量最多不超过20。 资源数量 单个环境管理的同类实例资源数量最多不超过2000。
为了减少调用链数据频繁上报给服务造成的性能影响,APM探针侧发送的调用链数据,默认情况下以最大100TPS的速率上报。在服务并发量超过100TPS的情况下,调用链不会全部上报,如有需要可以通过修改配置文件的方式修改上报阈值,但请做好性能开销的评估。 全采样功能在设置100%采样率
本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维人员使用开源的监控软件,虽然能采集很多指标,但却分散在各处,无法统一展示。
支持用户订阅指标或者告警信息,订阅后可以将数据转发到用户配置的kafka或DMS的Topic中,供消费者消费转发的订阅的信息。 应用发现 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用和关联的指标。 日志配置 提供日志配额和分词设置功能。 配额配置 当指标超过配额时,时间较早的指标将会被删除。
如何启用NGINX stub_status模块? Nginx Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,以root权限
以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap | grep establish -i 图1 查看hostIP地址 执行以下命令,查看IP地址对应的网卡,如图2所示。 ifconfig
AOM提供多场景、多层次、多维度指标与日志数据的监控能力,通过旧版接入中心快速接入需要监控的指标和日志,接入完成后,即可方便地在“指标浏览”页面查看相关资源或应用的运行状态、各个指标的使用情况、接入的日志等信息。 约束与限制 如果您进入的是新版接入中心,需要单击“接入中心”页面右上角“返回旧版”返回至旧版接入中心页面。
您可以通过AOM的监控功能监控资源的使用情况,评估当前配置是否过高。例如:CPU、内存、带宽等资源的利用率。寻找节约成本的机会。也可以根据成本分析阶段的分析结果识别成本偏高的资源,然后采取针对性的优化措施。
应用管理的可选节点,同一个应用下,最多可创建三层子应用。子应用可以理解为服务,对组件/微服务的归组分类。 组件 构成应用的最小单元,可以理解为应用程序或者应用依赖的一个中间件云服务组件,例如RDS,DMS。组件一般跟下面的环境一起组合使用,一个组件可以包含一个或者多个环境。比如一个订单的应用程序,包含功能测试环境,压力测试环境,预发环境以及现网环境等。
应用创建后,每个region都可以看到相同的应用拓扑信息。 子应用:应用管理的可选节点,同一个应用下,最多可创建三层子应用。子应用可以理解为服务,对组件/微服务的归组分类。 组件:构成应用的最小单元,可以理解为应用程序或者应用依赖的一个中间件云服务组件,例如RDS,DMS。组件一
企业项目是项目的升级版,针对企业不同项目间资源的分组和管理,是逻辑隔离。企业项目中可以包含多个区域的资源,且项目中的资源可以迁入迁出。 关于企业项目ID的获取及企业项目特性的详细信息,请参见《企业管理服务用户指南》。 调用说明 应用运维管理服务提供了REST(Representational State Transf
查看云服务类型Prometheus实例的指标:可以通过指标类型或资源类型过滤显示指标,也可通过输入指标名称中的关键字进行模糊搜索指标。 查看ECS类型Prometheus实例的指标:可以通过插件类型、采集任务或指标类型筛选指标,也可以通过输入指标名称中的关键字进行模糊搜索指标。 查看d
组件列表展示组件不同的指标监控项,AOM支持查看组件的指标监控项。 通过全局拓扑图查看应用间调用关系 通过拓扑图可以自动梳理服务之间的调用关系,同时也可以从全局视角查看服务之间调用是否正常,帮助用户快速定位问题。 通过调用链查看微服务间调用关系 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截
将鼠标悬浮于柱状图上,查看对应时间点各类型的事件数量。 单击柱状图上方的图例,可以隐藏或显示对应事件类型的数据。 在搜索栏根据关键字过滤显示需要查看的事件。 查看事件卡片(列表) 事件卡片(列表)中展示设置的时间段内事件巡检检测到的异常事件。您可以单击页面右上角切换事件展示形式,以卡片视角或列表视角展示事件。每个事件包含以下基本信息:
查看组件日志监控项 日志监控项可以搜索和查看日志,通过日志来分析和定位问题。 查看组件日志 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列,某一个组件名称,
安装ICAgent插件:当集群中的主机未安装ICAgent时,可以对所有主机安装ICAgent。 选择待执行安装操作的集群,单击“安装ICAgent”。 在弹出的页面中,单击“确认”,可对该集群所有主机安装ICAgent。 升级ICAgent插件:当集群中的主机安装的ICAgent版本较低时,可以对所有主机升级ICAgent。
安装ICAgent插件:当集群中的主机未安装ICAgent时,可以对所有主机安装ICAgent。 选择待执行安装操作的集群,单击“安装ICAgent”。 在弹出的页面中,单击“确认”,可对该集群所有主机安装ICAgent。 升级ICAgent插件:当集群中的主机安装的ICAgent版本较低时,可以对所有主机升级ICAgent。