检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
组件状态图表:实时监控组件的状态。 图5 组件状态图表 资源TopN图表 资源TopN图表的统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,支持资源Top5、Top15数据的汇报展示,其中默认展示资源Top5,放大图表后展示资源Top15。
在“业务监控(基于日志)”弹框中创建日志指标规则,将上报到LTS的日志数据提取为指标来统一管理,具体操作请参见配置日志指标接入AOM。 配置ELB日志指标接入AOM AOM支持创建日志指标规则,将ELB上报到LTS的日志数据提取为指标来统一管理,便于后续在指标浏览、仪表盘界面实时监控。 约束与限制: 如需通
范围。 在过滤器上方的下拉列表中选择需要查看的应用。 设置过滤器对事件巡检数据进行过滤。“过滤器”区域显示了当前时间段被巡检捕获的事件类型和状态,可以通过选择不同的分组查看事件。 过滤器支持按如下类型进行过滤。 事件类型:按照事件巡检发现的事件异常类型划分。支持的异常事件类型包括:
2.0服务生效。 前提条件 用户已被授予“AOMFullAccessPolicy ”、“iam:agencies:createAgency”和“iam:agencies:deleteAgency”。授权权限的具体操作请参见创建用户组并授权。 授权AOM访问其他云服务 登录AOM 2
待添加的监控数据项。 表4 MetricDataItem 参数 是否必选 参数类型 描述 collect_time 是 Long 数据收集时间,仅支持过去1天和未来半小时范围内的数据上报。即数据收集时间需要满足过去24小时到未来30分内。 取值范围: UNIX时间戳,单位毫秒。例如:2024-10-16
华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域) 告警规则 告警规则(包含阈值规则和事件类告警规则)最多可创建1000个。 静态阈值模板 静态阈值模板最多可创建50个。 通知规则(非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域) 发送通知可选择主题数
指标总览 简介 网络指标及其维度 磁盘指标及其维度 磁盘分区指标 文件系统指标及其维度 主机指标及其维度 集群指标及其维度 容器组件指标及其维度 虚机组件指标及其维度 实例指标及其维度 服务指标及其维度
监控总览 监控概览 仪表盘
历史API 弹性伸缩(即将下线) 监控(即将下线)
指标总览 简介 基础指标:虚机指标 基础指标:容器指标 基础指标:Modelarts指标 基础指标:IEF指标 基础指标:CSE指标 基础指标:IoTDA指标 基础指标:node-exporter指标 基础指标:Flink指标 指标维度
隐私声明 由于AOM会将运维数据内容展示到AOM控制台,请您在使用过程中,注意您的隐私及敏感信息数据保护,不建议将隐私或敏感数据上传到AOM,必要时请加密保护。 采集器部署 在弹性云服务器 ECS上手动部署ICAgent过程中,安装命令中会使用到您的AK/SK作为输入参数,安装前
告警监控 AOM告警监控概述 配置AOM告警通知 配置AOM告警规则 查看AOM告警或事件 配置AOM告警降噪
Prometheus监控 Prometheus监控概述 管理Prometheus实例 管理Prometheus实例指标数据 使用Prometheus监控CCE集群指标 配置多账号聚合实现指标统一监控 配置CCE集群监控采集指标规则 配置预聚合规则提升指标查询效率 配置数据多写实现监控指标转储到自建Prometheus
接入AOM 接入AOM总览 管理采集器底座UniAgent 业务层接入AOM 应用层接入AOM 中间件及自定义插件接入AOM 运行环境接入AOM 云服务接入AOM 开源监控系统接入AOM 管理日志接入
在左侧导航栏中选择“告警管理 > 告警降噪”。 在“分组规则”页签下单击 “创建分组规则”,设置规则名称、分组条件等信息。 图1 创建分组规则 表1 分组规则参数说明 参数 说明 示例 规则名称 分组规则的名称。 只能由大小写字母、数字、下划线组成,且不能以下划线开头和结尾,最多不能超过100个字符。
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
日志分析 AOM展示的日志是否为实时日志? 怎样查看AOM中的日志是通过哪个应用产生的?
基础设施监控 通过helm部署pod后,AOM无法查找到工作负载
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
enterprise_project_id String 企业项目id 最小长度:1 最大长度:64 id String 模板id,唯一标识,根据project_id和template_name生成。 最小长度:1 最大长度:64 is_collect Boolean 模板是否收藏,不允许更新模板时修改,更