检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 问题描述 ICAgent安装成功后,AOM无法监控到CPU内存使用率等信息。 原因分析 8149端口未连通。 用户侧节点时间与所在时区当前时间不一致。 解决方法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查ICAgent是否可成功上报指标。
该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) NTP服务器状态(aom_node_ntp_server_status) 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接
云服务器类型有两种:ECS云服务器、其他服务器。此处选择ECS云服务器。 ECS云服务器:ECS云服务器管理下的主机。 ECS云服务器 选择安装模式 安装模式当前仅支持命令行安装。 控制台会提供安装命令,您需要远程登录机器执行安装命令。 命令行安装 云服务器操作系统 操作系统当前仅支持Linux。
运维的自动化能力和效率。将ECS接入AOM后,可以通过AOM实时监控ECS主机状态,并提供告警通知。 本文以监控ECS主机的“node_network_up”指标为例,帮助您快速上手使用AOM。 操作流程 ECS主机手动安装UniAgent:手动为ECS主机安装Uniagent,统一管理指标采集插件。
该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) aom_node_ntp_server_status NTP服务器状态 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接
s、发送Bps。趋势图上方的值为最新时间点所选应用的接收Bps、发送Bps。 近30分钟CPU及内存使用率数据的趋势图,趋势图的每一个点分别表示1分钟内所选应用的CPU使用率以及内存使用率。趋势图上方的值为最新时间点所选应用的CPU使用率和内存使用率。 告警统计卡片 图3 告警统计
正常状态的工作负载,AOM界面显示异常是什么原因? 在AOM页面看到工作负载的状态显示异常,但是实际上在CCE页面看工作负载是正常的。 图1 查看工作负载状态 可能的原因如下: ICAgent的版本过低。 ICAgent当前需要用户主动升级的,但是过旧的ICAgent版本可能存在状态上报延迟导致显示异常的问题。
dent Set Size)。 ≥0 兆字节(MB) 状态(aom_process_status) 该指标用于统计进程状态是否正常。 0、1 0表示正常 1表示异常 无 线程数(aom_process_thread_count) 该指标用于统计测量对象使用的线程数。 ≥0 无 虚
在左侧导航栏中选择“云服务监控 > 云主机监控 > 弹性云服务器”。 登录CES控制台。 在左侧导航栏中选择“主机监控 > 弹性云服务器”。 主机监控 裸金属服务器 登录AOM 2.0控制台。 在左侧导航栏中选择“云服务监控 > 云主机监控 > 裸金属服务器”。 登录CES控制台。 在左侧导航栏中选择“主机监控
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
普罗语句语法 普罗语句语法详情可登录prometheus官网查看。 普罗语句查询举例说明 示例一:集群下指定pod占所在节点(不含控制节点)的内存使用率 定义变量: pod中容器内存实际占用量(同一个Pod下可能会有多个容器/实例):aom_container_memory_used_megabytes
安装ICAgent(非华为云主机) 前提条件 已购买弹性云服务器ECS作为跳板机。 满足AOM支持的操作系统及版本,支持amd64处理器架构。 弹性云服务器已绑定弹性IP地址。 确保本地浏览器的时间与弹性云服务器的时区、时间一致。 注意事项 非华为云上的服务器安装ICAgent时,系
通过界面卸载:此操作适用于正常安装ICAgent后需卸载的场景。 登录服务器卸载:此操作适用于未成功安装ICAgent需卸载重装的场景。 远程卸载:此操作适用于正常安装ICAgent后需远程卸载的场景。 批量卸载:此操作适用于正常安装ICAgent后需批量卸载的场景。 服务器上的ICAgen
当满足以下条件时,您需要按照该方式安装: 该服务器上未安装过ICAgent。 继承安装 当满足以下条件时,您需要按照该方式安装: 您有多个服务器需要安装ICAgent,其中一个服务器绑定了EIP,而剩余的没有绑定EIP。其中一个服务器已经通过首次安装方式装好了ICAgent,对于没有绑定EIP的服务器,您可以采用该安装方式。
非华为云上的服务器安装ICAgent,请先在华为云上购买一台弹性云服务器作为跳板机,然后执行如下操作: 推荐CentOS 6.5 64bit及其以上版本的镜像, 最低规格为1vCPUs | 1GB,推荐规格为2vCPUs | 4GB。 登录弹性云服务器,修改跳板机ECS使用的安全组规则。
卸载ICAgent 服务器上的ICAgent被卸载后,会影响该服务器的运维能力,导致拓扑、调用链等功能不可用,请谨慎操作! 通过界面卸载:此操作适用于正常安装ICAgent后需卸载的场景。 登录服务器卸载:此操作适用于未成功安装ICAgent需卸载重装的场景。 通过界面卸载 登录
称设置为“主机名称”,正则表达式设置为“192.*|172.*”,表示只监控主机名为“192.*”和“172.*”的资源。 匹配方式为“!~”:此时维度值根据设置的一个或多个正则表达式确定,多个正则表达式间通过“|”间隔。例如,维度名称设置为“主机名称”,正则表达式设置为“192
本地PC或物理服务器一样,在云上使用弹性云服务器。 您购买了弹性云服务器(弹性云服务器操作系统需满足表4中的使用限制,且购买后需要给弹性云服务器安装UniAgent,否则无法使用AOM监控)后,在AOM界面可对弹性云服务器的基础资源和运行在其上的应用进行监控,同时在AOM界面还可查看相关的日志和告警。
通过接入中心配置云服务接入AOM:“Prometheus for 云服务实例”默认选择为所选“企业项目”下的云服务类型Prometheus实例。如果当前企业项目下暂无云服务类型的Prometheus实例,可单击“请立即创建”,自动为您创建云服务类型的Prometheus实例。 接入云服务标签(可选)
选中多个主机前的复选框,单击“批量操作Agent”,即可批量开启、停止、删除Agent。 表1 Agent状态说明 状态 说明 正常 该Agent运行正常。 离线 由于网络问题导致该Agent功能异常,请检查并恢复网络。 停止 该Agent被手动停止或全局停止,请联系技术人员处理。