检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建消息模板 AOM提供消息模板功能,可通过创建消息模板自定义配置通知消息,当AOM触发已设定的告警通知策略时,可通过此功能以您自定义消息模板的邮件、短信、企业微信、钉钉、语音、HTTP或HTTPS形式通知指定的人员。如果您未创建任何消息模板,则采用默认消息模板。 创建消息模板 在左侧导航栏中选择“告警
系统处理方式包括:告警、数据不足并发送事件、保持上一个状态、正常。 图1 设置告警条件 根据需要设置告警标签和告警标注信息,为告警匹配分组,后续可关联告警降噪策略来发送告警通知。详细说明请参见标签和标注。 单击“添加自定义标签”或“添加自定义标注”可添加多条信息。 设置告警通知策略。告警通知策略有两种方式,请根据需要选择:
本章为您介绍如何添加、查看、删除接入规则。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南、CCI用户指南;已配置容器服务日志采集路径。 添加接入规则 将AOM中的CCE、C
创建通知规则 该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 AOM提供了告警通知功能,您可通过创建通知规则进行详细配置,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,可利用此功能将告警信息通过邮件或短信发送给您
信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 目前对于华北-北京一、华东-上海二和华南-广州区域,统计规则支持关键词统计和SQL统计。两者的区别在于统计对象不同。关键词统计的对象为原
参考信息 Agent包下载配置
UniAgent管理 下发批量安装UniAgent任务 下发批量升级UniAgent任务 查询UniAgent主机列表信息 父主题: API
通过AOM监控进程 配置AOM应用发现规则 通过AOM监控应用进程 通过AOM监控组件进程 父主题: 基础设施监控
日志管理 日志管理使用说明 搜索日志 查看日志文件 添加日志桶 查看桶日志 添加日志转储 创建统计规则 接入LTS 容器日志采集配置
查看操作日志 AOM会记录用户对UniAgent和其他插件执行安装、升级、卸载历史任务的操作日志。您可以查看相关任务的操作日志。 查看UniAgent操作日志 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。
查看操作日志 AOM会记录用户对UniAgent和其他插件执行安装、升级、卸载历史任务的操作日志。您可以查看相关任务的操作日志。 查看UniAgent操作日志 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。
API 告警 监控 prometheus监控 日志 Prometheus实例 配置管理 UniAgent管理 仪表盘 应用资源管理(aom2.0接口) 自动化运维(aom2.0接口)
分页查询时需要增加三个参数:lineNum(上一次查询出的内容中最后一条日志的序列号)、type(取值"next")和size。 2.category、searchKey、keyWord、startTime、endTime等条件需要保持和第一次查询时相同。 3.如果需要继续分页查询,则修改请求参数中的lineNum为
应用监控概述 查看应用性能指标 监控组件性能指标 通过全局拓扑图查看应用间调用关系 通过调用链查看微服务间调用关系 管理APM探针启停状态 APM配置
基础设施功能支持通过仪表盘图表展示APM实例下的性能指标数据。例如,折线图、数字图等,帮助用户全面、深入地掌握应用性能监控数据。 约束与限制 需要提前在组件设置中配置组件与基础设施关联分析设置后,组件详情页面才会展示基础设施页签。 查看组件基础设施 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控
容器组件指标及其维度 表1 容器指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_container_cpu_limit_core) 该指标用于统计测量对象限制的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_container_cpu_used_core)
据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
仪表盘支持通过变量拼接填充图表标题。新增变量后,在仪表盘配置图表标题处使用“${变量名称}”进行拼接填充,即可基于该变量的过滤器下拉列表值,动态展示图表标题信息。 例如:仪表盘配置的原图表标题为“Dashboard”,新增的变量名称为“ClusterName”,即可以在仪表盘图表标题处配置“${ClusterName}
查询事件告警信息 功能介绍 该接口用于查询对应用户的事件、告警。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/events 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取