检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看操作日志 AOM会记录用户对UniAgent和其他插件执行安装、升级、卸载历史任务的操作日志。您可以查看相关任务的操作日志。 查看UniAgent操作日志 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择
管理主机组(新版) 主机组是为了便于分类管理、提升配置多个主机数据采集的效率,对主机进行虚拟分组的单位。您可以将多个主机加入到同一个主机组,并将该主机组关联至对应的接入规则配置中。配置接入规则时以主机组为单位下发采集配置,方便对多台主机数据进行采集。当用户扩容主机时,只需在主机组中添加主机
管理主机组(新版) 主机组是为了便于分类管理、提升配置多个主机数据采集的效率,对主机进行虚拟分组的单位。您可以将多个主机加入到同一个主机组,并将该主机组关联至对应的接入规则配置中。配置接入规则时以主机组为单位下发采集配置,方便对多台主机数据进行采集。当用户扩容主机时,只需在主机组中添加主机
监控云容器引擎 CCE的指标 云容器引擎 CCE是一个企业级的集群托管服务,基于云服务器快速构建高可靠的容器集群,帮助您轻松创建和管理多样化的容器工作负载。应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台
文件系统指标及其维度 表1 文件系统指标 指标名称 指标含义 取值范围 单位 可用磁盘空间(aom_node_disk_available_capacity_megabytes) 还未经使用的磁盘空间。 ≥0 兆字节(MB) 磁盘空间容量(aom_node_disk_capacity_megabytes
查看桶日志 桶日志是AOM提供的一种细粒度日志查询功能,您可以日志桶为单位查看日志,以便提取关键业务数据、快速查看并定位问题。 目前对于华北-北京一、华东-上海二和华南-广州区域,桶日志支持多维度日志信息查询和检索,您可对原始日志进行查询与分析,也可对结构化后的日志进行SQL查询与分析
删除消息通知模板 功能介绍 该接口用于删除消息通知模板。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
Debugging诊断概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。 解决方案 AOM
策略授权参考 本章节介绍AOM策略授权场景下支持的策略授权项。 支持的授权项 策略包含系统策略和自定义策略,如果系统策略不满足授权要求,管理员可以创建自定义策略,并通过给用户组授予自定义策略来进行精细的访问控制。策略支持的操作与API相对应,授权项列表说明如下: 权限:允许或拒绝某项操作
管理脚本 “脚本管理”页面展示现有的所有脚本信息。您可以在这里创建脚本,也可以修改、复制已创建的脚本。创建完成后,可以为脚本新建执行任务,也可创建任务后在任务管理中执行并查看。每个脚本支持最多创建20个版本,单用户支持创建的所有脚本的版本合计最多1000个。 创建脚本 登录AOM
创建阈值规则 通过阈值规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 创建方式 阈值规则的创建方式分为两种:自定义阈值规则和使用模板创建阈值规则。一次创建后,只生成一条规则,无论是一个还是多个资源,均通过同一条规则进行监控
PostgreSQL Exporter接入AOM实现指标监控 应用场景 使用PostgreSQL过程中需要对PostgreSQL运行状态进行监控,以便了解PostgreSQL服务是否运行正常,及时排查PostgreSQL故障问题原因。Prometheus监控服务提供了CCE容器场景下基于
配置预聚合规则提升指标查询效率 预聚合(Recording Rule)可以对落地的指标数据做二次开发。您可以配置预聚合规则将计算过程提前写入端,减少查询端资源占用。 应用场景 某些指标查询可能需要在查询端进行大量的计算,查询端压力过大,影响查询性能。通过配置预聚合规则对一些常用的指标或者计算相对复杂的指标进行提前计算
查询单条阈值规则 功能介绍 该接口用于查询单条阈值规则。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/alarm-rules/{alarm_rule_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
使用Prometheus监控CCE集群指标 AOM基于Prometheus监控生态,提供了托管式的CCE类型Prometheus实例 ,适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。CCE Prometheus实例默认提供对容器服务CCE集群的Prometheus云原生监控插件的集成
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择
设置组件监控开关 AOM支持设置如下APM组件监控开关: 自定义设置:支持设置关联日志服务开关项、组件与基础设施关联分析开关项、Profiler性能剖析开关项、全采样开关项。 Agent设置:支持管理APM探针启停状态。 监控项:支持查看监控项,以及启停监控项。 自定义设置 自定义设置支持的配置项包括
创建AOM告警分组规则 告警分组规则功能可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 约束与限制 您最多可创建100条分组规则,如果分组规则数量已达上限100时,请删除不需要的分组规则。 当前仅华南-广州区域“告警管理