检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 使用限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能,存在应用崩溃的风险。 Debugging诊断仅针对白名单用户开放。 表1 Agent版本说明
器界面上提示状态异常? ICAgent安装成功后,无法在界面上获取到ICAgent状态 ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 如何获取AK/SK? ICAgent安装类常见问题 如何创建终端节点? 如何启用NGINX stub_status模块? A
指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。指标分为系统指标和自定义指标。 系统指标:AOM提供的基础指标,例如:CPU使用率、CPU内核占用等。 自定义指标:您自己定义的指标。可参考如下两种方式上报自定义指标。 方式一:通过AOM提供的接口上报自定义指标,接口详见添加监控数据和查询监控数据。
Rule)可以对落地的指标数据做二次开发。某些查询可能需要在查询端进行大量的计算,导致查询端压力过大,通过配置预聚合规则将计算过程提前到写入端,可减少查询端资源占用,尤其在大规模集群和复杂业务场景下可以有效的降低PromQL的复杂度,从而提高查询性能,解决用户配置以及查询慢的问题。 前提条件 服务已接入CCE类型Prometheus
关闭 用户自定义ServiceMonitor或PodMonitor配置采集指标并上报指标到AOM,产生相关费用。比如容器场景自定义中间件mysql、nginx、业务指标等。 云服务场景 云服务接入AOM Prometheus实例后,部分云服务产生计费。具体如下: 不计费云服务:Mo
分布式缓存服务 分布式缓存服务(Distributed Cache Service,简称DCS)是一款内存数据库服务,兼容了Redis、Memcached和内存数据网格三种内存数据库引擎,为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力,满足高并发及数据快速访问的业务诉求。
单击“已接入采集任务”,可查看已接入的采集任务,并根据需要删除不需要的采集任务。 (可选)在右侧“已安装”面板选择需要接入的插件卡片,单击“接入XX”,例如“接入MySQL”,可为当前插件卡片配置多个采集任务。 父主题: 创建Prometheus实例
分布式缓存服务 分布式缓存服务(Distributed Cache Service,简称DCS)是华为云提供的一款内存数据库服务,兼容了Redis、Memcached和内存数据网格三种内存数据库引擎,为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力,满足高并发及数据快速访问的业务诉求。
资源监控 表1 资源监控基本概念 术语 说明 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计
资源使用限制 对象 使用限制 Agent客户端 当连续两分钟平均CPU使用率大于50%或者内存大于100M时,Agent客户端将自动重启。 Agent安装、升级或卸载 一次最多可对100台主机安装、升级或卸载Agent。 主机删除 一次最多可删除50台卸载了Agent的主机记录。
基本概念 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都
U核总量。 表达式设置为“a/b”,最终计算结果即为主机的CPU内核占用率。 检测规则设置为“最大值>0.2”。 触发条件设置为“连续周期:3” 告警级别设置为“紧急”。 当连续3个统计周期,主机CPU内核占用率的最大值大于0.2时,则触发紧急告警。 指标 需要监控的指标。通过“
道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来,提升运维操作的质量和效率,帮助企业运维转型和运维价值提升。
PostgreSQL组件接入 操作场景 您可以直接使用AOM内置的PostgreSQL插件来创建采集任务,通过快捷安装配置PostgreSQL插件,就可以监控PostgreSQL相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。
日志流A不会复制或移动原AOM日志流中的历史数据,如图2所示。 图2 已创建映射 修改映射 如果您需要修改映射,如:将映射规则从日志流A变更为日志流B,最新的日志将上报至日志流B,AOM可以查询AOM日志流和日志流B的内容,无法查看日志流A的内容,如图3所示。 图3 修改映射 删除映射
阈值条件:阈值告警的触发条件,由判断条件(≥、≤、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 连续周期:连续多少个周期满足阈值条件后,发送阈值告警。 统计周期:指标数据按照所设置的统计周期进行聚合。 告警级别:阈值告警的级别,包括:紧急、重要、次要、提示。
1个主机状态图表最多可添加10个主机。 1个组件状态图表最多可添加10个组件。 指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 指标总量 单租户总指标量不超过40W 小规格总指标量不超过10W 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。
随着AOM 1.0相关功能逐步被AOM 2.0全面取代,AOM 1.0后续会逐步下线,建议用户将AOM 1.0升级到AOM 2.0版本,升级的相关操作请参见升级AOM。
PostgreSQL Exporter接入 操作场景 使用PostgreSQL过程中需要对PostgreSQL运行状态进行监控,以便了解PostgreSQL服务是否运行正常,及时排查PostgreSQL故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Expor
1个主机状态图表最多可添加10个主机。 1个组件状态图表最多可添加10个组件。 指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 指标总量 单租户总指标量不超过40W 小规格总指标量不超过10W 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。