检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Authorization:签名认证信息,可选,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。AK/SK认证的详细说明请参见AK/SK认证。 X-Sdk-Date:请求发送的时间,可选,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该
业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间
需版(按需计费)来修改。 指标配置 指标采集开关用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。 使用流程 AOM使用流程如下图所示。 图1 AOM使用流程 开通AOM(必选) 创建子账号并设置权限(可选) 购买云主机(必选) 安装ICAgent(必选) ICAge
以为空。单位ms。 选填 是否异常 调用链是否有异常。 选填 Trace ID 调用链的TraceID。填写该搜索条件后,其他搜索条件全部失效,只根据该TraceID搜索。 选填 自定义参数 按调用参数搜索调用链,格式为:key=value。例如:httpMethod=POST。
提供详细的方案描述和操作指导,帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 通过多
例如,设置连续周期为“2”,则表示连续2个周期不满足告警条件,恢复告警。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。默认只监控一个周期,最多可监控5个连续周期指标数据。 系统处理方式包括:超限阈值并发送告警、数据不足并发送事件、保持上一个状态、正常并发送清除告警。
组分类。 组件 构成应用的最小单元,可以理解为应用程序或者应用依赖的一个中间件云服务组件,例如RDS,DMS。组件一般跟下面的环境一起组合使用,一个组件可以包含一个或者多个环境。比如一个订单的应用程序,包含功能测试环境,压力测试环境,预发环境以及现网环境等。 环境 用于区分一个组
Exporter接入AOM实现指标监控 应用场景 使用数据库Redis过程中需要对Redis运行状态进行监控,以便了解Redis服务是否运行正常,及时排查Redis故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Redis运行状态。本文为您介绍如何使用Prometheus监控Redis。
gent安装与配置界面上显示状态异常。 问题原因 状态异常说明您安装的AK/SK等凭据不正确,或者使用委托安装的方式但没有设置委托导致ICAgent状态异常。 解决方法 请参考如何通过创建委托授权安装ICAgent,获取AK/SK重新安装ICAgent即可。 父主题: 采集管理
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上
er的方式来监控Memcached运行状态。本文为您介绍如何使用Prometheus监控服务Memcached。 约束与限制 为了方便安装管理Exporter,推荐使用云容器引擎 CCE进行统一管理。 前提条件 CCE服务已拥有CCE集群,已安装Memcached。 服务已接入可
及其以上版本,上表所列的其他操作系统对应版本均支持。 资源使用限制 在使用AOM时,您需注意以下使用限制,详见表2。使用限制中部分内容属于配额,关于什么是配额以及怎样查看与修改配额,详见关于配额。 表2 资源使用限制 分类 对象 使用限制 仪表盘 仪表盘 1个区域中最多可创建50个仪表盘。
AOM提供告警规则和事件规则设置功能。通过创建指标、日志、云监控和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则 通过指标告警规则可对资源的指标设置阈值条件,
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能
告警规则分为指标告警规则和事件告警规则两种。 通过指标告警规则,实时监控环境中主机、组件等资源使用情况。 当资源使用告警过多,告警通知过于频繁时,通过事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 告警通知 告警通知有2种方式: 直接告警:在配置告警规则的时候,可
Exporter接入AOM实现指标监控 应用场景 使用Kafka过程中需要对Kafka运行状态进行监控,例如集群状态、消息消费情况是否有积压等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Kafka运行状态。本文介绍如何部署Kafka Exporter以及实现Kafka
以之前配置的分词符进行处理。 配置分词 在左侧导航栏中选择“配置管理 > 日志配置”,选择“分词配置”页签。 配置分词。 AOM提供了如下两种配置分词的方法。若同时使用了这两种配置方法,则分词符取并集。 自定义分词符:单击,在文本框中输入分词符,单击。 使用ASCII码:单击“添
如何启用NGINX stub_status模块? Nginx Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,以root权限
清理磁盘空间 使用清理磁盘空间原子服务场景创建任务后,您可以对ECS虚拟机的指定目录进行磁盘清理,释放内存。 前提条件 ECS实例均已成功安装UniAgent,并且UniAgent的状态为运行中。 创建清理磁盘空间任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。
ICAgent安装成功后,无法在界面上获取到ICAgent状态。 原因分析 用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决方法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap