检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ECS云服务器:ECS云服务器管理下的主机。 其他服务器:其他服务器管理下的主机。 ECS云服务器 选择安装模式 选择安装模式当前仅支持命令行安装。 控制台会提供安装命令,您需要远程登录机器执行安装命令。 命令行安装 云服务器操作系统 选择云服务器操作系统当前仅支持Linux。 Linux UniAgent版本
成功。 如果升级后,界面显示ICAgent状态异常或者其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 父主题: ICAgent管理(华为云主机)
日志文件轮转速度过快,如1秒轮转一次。 系统安全设置或syslog自身原因导致无法转发日志。 容器运行时间过短,例如小于30s。 单节点总日志产生速度过快,超过了单节点网络发送带宽或日志采集速度,建议单节点总日志产生速度<5M/s。 日志丢弃 当单行日志长度超过1024字节时,此行会被丢弃。 日志重复 当采集
配置应用发现规则 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则发现主机上的应用,并呈现在“应用监控”界面。
日志文件轮转速度过快,如1秒轮转一次。 系统安全设置或syslog自身原因导致无法转发日志。 容器运行时间过短,例如小于30s。 单节点总日志产生速度过快,超过了单节点网络发送带宽或日志采集速度,建议单节点总日志产生速度<5M/s。 日志丢弃 当单行日志长度超过1024字节时,此行会被丢弃。 日志重复 当采集
安装了ICAgent,但是监控不到主机是什么原因? 问题描述 安装了ICAgent,且节点上ICAgent进程正常,但是无法监控到主机。 可能原因 一般情况下,在AOM页面看不到主机主要有以下几种原因: ICAgent未安装成功 ICAgent安装成功但是配置错误 ICAgent安装成功但是数据采集失败
采集路径如果配置的是目录,示例:/var/logs/,则只采集目录下后缀为“.log”、“.trace”和“.out”的文件;如果配置的是文件名,则直接采集对应文件,只支持文本类型的文件。 采集路径不能重复配置,即同一主机下的同一路径,即使跨日志组和日志流,也只能配置一次。 Windows
运维配置 管理OS账号 管理访问凭证 查看场景分类 父主题: 运维管理
配置管理 查询aom2.0相关云服务授权信息 查询主机安装的ICAgent信息 父主题: API
配置容器服务日志采集路径 AOM支持容器服务日志采集,并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径,配置方法详见如下操作。 注意事项 ICAgent只采集*.log、*.trace和*.out类型的文本日志文件。 配置步骤 在CCE中添加日志策略 在CCE
告警抑制规则功能可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
auth和Skip TLS Verify的开关必须开启。 图4 配置参数 配置完成后,单击“Save&Test”,验证是否配置成功。 配置成功即可使用Grafana配置Dashboards,查看指标数据。 图5 配置完成 父主题: Prometheus监控
虚机指标。 弹性云服务器 ECS 单击“弹性云服务器 ECS”卡片,在弹框中安装Prometheus官方提供的Node Exporter,即可采集Linux类型主机节点的相关信息和运行指标,具体操作请参见配置弹性云服务器 ECS接入AOM。 配置弹性云服务器 ECS接入AOM Node
登录AOM控制台,在左侧导航栏中选择“配置管理 > 日志配置”。 在“配额设置”页签下可以查看您当前使用日志大小、存储时长。 如果在AOM中已创建日志接入LTS规则,则实际的日志存储时长以LTS中“日志管理”界面设置的“日志存储时间(天)”为准,“配置设置”界面的“日志存储时长”不生效。
在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中选择“全局开关”,根据需要开启和关闭“指标采集开关”。 图1 全局开关 配置告警消息内容显示资源的TMS标签开关 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中选择“全局开关
聚指标。 普罗语句语法 普罗语句语法详情可登录prometheus官网查看。 普罗语句查询举例说明 示例一:集群下指定pod占所在节点(不含控制节点)的内存使用率 定义变量: pod中容器内存实际占用量(同一个Pod下可能会有多个容器/实例):aom_container_memory_used_megabytes
局查看所有的云服务资源对象与应用的关联关系,包括未绑定应用的云资源,便于用户对资源进行分析和管理。 目前支持对以下资源类型的管理: 云服务器ECS,数据库(关系型数据库RDS、数据复制服务DRS、云数据库GaussDB NoSQL、云数据库 GaussDB),网络(虚拟私有云VPC、弹性负载均衡器ELB、弹性公网IP
前提条件 已购买弹性云服务器ECS。 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 配置自建Prometheus数据上报到AOM 安装并启动开源版Prometheus,具体操作请参见Prometheus官方文档。(如果已经部署并正在使用开源
配置AOM应用发现规则 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用、组件和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则说明发
配置代理区域和代理机 为解决多云之间网络互通,需要在华为云购买和配置ECS主机为代理机,同时代理机上需要绑定公网IP,AOM通过该代理机下发部署控制命令到远程主机,运维数据也将经过该代理机至AOM。代理区域是对代理机进行分类管理,由多个代理机组成。 配置代理区域和代理机 登录AOM