检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
该指标用于统计测量对象的显存容量。 ≥0 兆字节(MB) gpuMemUsage gpuMemUsage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) gpuMemUsed gpuMemUsed 显存使用量 该指标用于统计测量对象已使用的显存。
配置指标或日志接入AOM 登录AOM 2.0控制台。 在左侧导航栏选择“接入 > 接入中心”。 您可以根据不同类型的监控对象,接入对应的指标或日志: 表1 接入总览说明 类型 监控对象 数据源 接入方式 业务层接入 ELB日志 指标 业务层接入AOM APM事务 Browser监控 业务监控(基于日志)
该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_node_cpu_usage) 该指标用于统计测量对象的CPU使用率。
或者到组织追踪器配置的OBS桶中查看,也可以到组织追踪器配置的CTS/system日志流下面去查看。 用户通过云审计控制台只能查询最近7天的操作记录。如果需要查询超过7天的操作记录,您必须配置转储到对象存储服务(OBS)或云日志服务(LTS),才可在OBS桶或LTS日志组里面查看
ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) ma_container_cpu_used_core CPU内核占用量 该指标用于统计测量对象已经使用的CPU核个数 ≥0 核(Core) ma_container_cpu_limit_core
线程分析支持显示该应用的所有线程和查看线程的堆栈信息。通过Debugging诊断线程,帮助用户快速定位耗时较高的线程。 约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控
提供批量磁盘清理、作业编排、脚本执行等功能,将日常运维操作服务化、标准化、自动化。 应用资源管理 通过应用管理、资源搜索等功能,将所有资源对象与应用统一管理,为AOM上层运维场景服务提供准确、及时、一致的资源配置数据。 采集管理 统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。
String 所属project ID。 version String UniAgent版本。 is_hw_cloud_host String 是否华为云机器。 vpc_id String VPC ID。 cmdb_id String CMDB ID。 ecs_id String ECS ID,唯一值。
Debugging诊断概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK
高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。 告警清除:支持单个、批量清除告警。 告警详情:在告警详情中查看告警对象的信息和修复建议,所有的告警都提供修复建议。 在事件列表中,有以下关键功能: 事件列表:支持按事件级别图形化查看告警信息。 高级过滤:支持在搜索框中按事件级别
障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 您最多可创建100条抑制规则,如果抑制规则数量已达上限100时,请删除不需要的抑制规则。 创建告警抑制规则
点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 > 告警降噪”。 在“抑制规则”页签下单击
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
息。 目前对于华北-北京一、华东-上海二和华南-广州区域,统计规则支持关键词统计和SQL统计。两者的区别在于统计对象不同。关键词统计的对象为原始日志;SQL统计的对象为结构化后的日志,且只有返回单个数值的SQL语句才能创建统计规则,例如select count(*) where code
u_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。 表达式设置为“a/b”,最终计算结果即为主机的CPU内核占用率。
设置告警规则的详细信息。 设置“规则类型”为“事件类告警”。 设置告警来源、触发对象和触发策略。 表1 告警规则填写说明 参数名称 填写说明 告警来源 事件类告警来源的服务名称,从现有的服务列表中选择。 触发对象 服务事件的筛选条件。从通知类型、事件名称、告警级别、自定义属性、命名空间
设置“规则类型”为“阈值规则”。 选择监控对象。通过以下两种方式选择: 选择资源对象:单击“选择资源对象”,通过“按资源添加”或“按指标维度添加”方式在资源树上选择待监控的资源,设置完成,单击“确定”。 监控对象最多可添加100条指标数据。 选择监控对象时,如果开启了应用到所有开关,将会
简介 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS
关人员,以便及时获取资源运行状态等信息并采取相应措施,避免因资源问题造成业务损失。SMN-价格说明 日志转储:依赖对象存储服务(简称OBS),将日志文件转储到OBS桶中,以便进行长期存储。OBS-价格说明 日志订阅和阈值告警订阅:依赖分布式消息服务Kafka版,发送日志或阈值告警
仅支持50。 支持添加20+云服务,每个云服务支持添加100+告警规则。 历史告警保存时间 7天。 1年。 单次创建告警规则可选择的被监控对象数 5000 不限制,支持全部资源、正则匹配、精准匹配。 聚合告警 不支持 支持基于PromQL语法的聚合告警,例如:按CDN总带宽、EIP总带宽和OBS存储等条件聚合告警。