检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参考信息 Agent包下载配置
“alarm_policy”:告警降噪 枚举值: direct alarm_policy route_group_enable Boolean 启用分组规则。 当通知类型为“alarm_policy”时:true 当通知类型为“direct”时:false 如果告警触发“notify_
如何区分Prometheus监控功能采集的基础指标和自定义指标数据? ICAgent和UniAgent是同一个插件吗? ECS主机上执行UniAgent安装命令,下载安装脚本失败 更多 技术专题 技术、观点、课程专题呈现 分布式追踪技术 全面解析应用运维分布式追踪技术 立体运维解决方案
通过AOM监控进程 配置AOM应用发现规则 通过AOM监控应用进程 通过AOM监控组件进程 父主题: 基础设施监控
JAVE、GO、Python、Node.js、PHP、.NET、C++等组件调用链接入APM,并支持查看组件日志接入LTS相关操作文档。 配置组件层接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 > 接入中心”,进入新版接入中心页面。当前仅华南-广州区域的菜单路径为“接入中心
日志管理 日志管理使用说明 搜索日志 查看日志文件 添加日志桶 查看桶日志 添加日志转储 创建统计规则 接入LTS 容器日志采集配置
API 告警 监控 prometheus监控 日志 Prometheus实例 配置管理 UniAgent管理 仪表盘 应用资源管理(aom2.0接口) 自动化运维(aom2.0接口)
图2 设置告警规则 设置告警通知策略。告警通知策略有两种方式,请根据需要选择: 直接告警:满足告警条件,直接发送告警。 需要设置是否启用告警行动规则。启用后,系统根据关联SMN主题与消息模板来发送告警通知。如果现有的告警行动规则无法满足需要,可单击“新建告警行动规则”添加。设置告警行动规则的操作详见创建告警行动规则。
场景描述 本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用率metric_
展示了每个应用的名称、运行状态、部署方式等信息。AOM支持从应用下钻到组件,再从组件下钻到实例,从实例下钻到进程。通过各层状态,您可完成对应用的立体监控。在AOM的应用发现界面配置应用发现规则,可自动发现符合规则的应用并监控相关指标,详情请参考配置AOM应用发现规则。 通过AOM监控应用进程
场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式统一,部分指标被
采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。 图1 告警管理使用流程 父主题: 告警管理
据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
S桶中,以便进行长期存储。日志数据的相关费用统一由LTS提供并上报话单,AOM不会双算。 指标数据:通过数据订阅功能,将指标数据转发到用户配置的DMS或Webhook的Topic中存储。
通过指标监控、日志分析、服务异常报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。 优势 应用自动发现:自动部署采集器,针对应用的运行环境,主动发现应用并进行监控。 跨云服务的分布式应用监控:对于同时使用了多种云服务的分布式应用,提供统一的运维平台,便于您对业务进行立体排查。
内存workingset使用率 容器采集支持通过标签区分stderr.log和stdout.log 容器上报增加Pod_ip的tag **配置匹配当前目录文件 5.12.98 增加LTS日志黑名单功能,更改容器指标来源为working_set 5.12.96 新增云资源发现类型 5
${message};\\n最新指标值: ${current_data};\\n本消息是由${domain_name}在AOM告警规则中配置;\"},{\"subType\":\"webhook\",\"version\":\"v2\",\"content\":\"通知类型:$
描述 type String 节点类型。 最小长度:1 最大长度:32 configuration Map<String,Object> 配置信息。 表9 Parameter 参数 参数类型 描述 param_name String 参数名称。 param_type String
通知给指定消息接收人。 详细介绍请参见使用预测和预算来跟踪成本和使用量。 资源优化 您可以通过AOM的监控功能监控资源的使用情况,评估当前配置是否过高。例如:CPU、内存、带宽等资源的利用率。寻找节约成本的机会。也可以根据成本分析阶段的分析结果识别成本偏高的资源,然后采取针对性的优化措施。
Prometheus实例id。 alarm_rule_description String 告警规则描述。 alarm_rule_enable Boolean 是否启用。 alarm_rule_status String 告警状态。 “OK”:正常 “alarm”:超限阈值 “Effective”:生效中