检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在查看主机监控的监控指标时,如果出现操作系统监控GPU页面显示无记录的问题,请先确认您的机器是否支持GPU。若您的机器支持GPU且驱动运行正常,请参考以下操作步骤升级插件为增强版: 卸载当前基础版Agent: Linux平台:登录机器执行命令 bash /usr/local/uniagent/script/uninstall
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
主机监控分为基础监控、操作系统监控、进程监控。 基础监控:ECS/BMS自动上报的监控指标。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。
Agent状态切换或监控面板有断点该如何处理? 问题现象 当云监控服务的Agent进程出现以下现象时,可能是因为Agent负载过高,状态不稳定导致: 管理控制台主机监控页面的“插件状态”参数在“运行中”和“故障”两个状态切换。 监控指标面板中存在断点。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。
主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 应用场景 促销、秒杀、爆款等电商业务场景,瞬间访问量达到平常的几十至数百倍,会导致服务器负载高,系统响应慢。
机器或者单台安装,更高效、便携,推荐用户使用该种方式进行安装。 图5 安装&升级插件 安装完成Agent,可以在主机监控列表页进行查看,“插件状态”列显示“运行中”状态的即为插件安装成功。 图6 插件状态 查看主机监控指标 从主机监控列表页“名称/ID”单击资源或者“查看监控指标”进入主机监控指标详情页。
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 安装配置Agent成功,需要等待2分钟,管理控制台上才会有操作系统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数
Agent一键修复失败问题排查 Agent一键修复后无监控数据问题排查 上报的指标被丢弃问题排查 Agent插件状态显示“故障”该如何处理? Agent插件状态显示“已停止”该如何处理? Agent插件状态显示“运行中”但没有数据该如何处理? Agent一键修复后无监控数据问题排查(老版本Agent)
拉美区域上线Agent采集插件能力。 Agent插件上线墨西哥城一、圣保罗一和圣地亚哥区域。 商用 Agent安装配置方式说明 2 上线Agent插件的一键安装能力,支持上海一和北京一区域。 您能够通过以下方式,非常方便地安装云服务器监控Agent插件: 1、在云服务器购买流程页
Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束 BMS硬件监控指标采集说明 什么是插件修复配置? 怎样让新购ECS实例中带有操作系统监控功能?
云资源监控 监控数据管理 监控看板 监控视图 资源标签管理 指标管理 插件状态查询 Agent任务相关接口 父主题: API
主机监控 概览 云监控插件(Agent) 进程监控 查看主机监控的监控指标 创建主机监控的告警通知 查看主机监控的资源详情 父主题: 云资源监控
事件ID 事件级别 事件说明 处理建议 Cloud Eye SYS.CES 插件故障事件 agentHeartbeatInterrupted 重要 监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 查看Agent域名是否无法解析。 查看账号是否欠费。
根据ECS/BMS资源ID查询磁盘、挂载点、进程、显卡、RAID控制器维度指标信息。 API V3 插件状态查询 插件状态查询(ListAgentStatus) 插件状态查询,包括uniagent状态以及插件状态。 Agent任务相关接口 查询Agent任务列表(ListAgentInvocations)
Eye服务的数据。将服务接入Prometheus前,需要先安装配置CES Exporter。 拓展标签支持情况 该插件对于已对接云监控的云服务均支持指标数据的导出。为提高云服务资源的识别度、可读性,插件对于以下服务支持导出资源属性label,如ECS实例会增加hostname、ip等label,同
案例三 ECS实例未安装agent插件 在CES页面“主机监控”下的【弹性云服务器】中找到对应ECS的实例,在【插件状态】列点击,未安装,然后根据使用指南安装agent插件。 案例四 ECS实例安装的agent插件没有上报磁盘使用率指标数据 agent插件故障导致没有上报指标数据,详见agent常见问题排查。
建议在拆分时,选择将拆分后的挂载点规则,替换为全部挂载点。 图1 配置挂载点告警规则优化前后示意图 前提条件 云服务器已经安装了Agent插件。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击告警,进入告警规则界面,然后单击“创建告警规则”。 在“创建告警规
自动启动,您可以直接到云监控服务查看该资源运行状态并设置告警规则。 主机监控: 通过在弹性云服务器或裸金属服务器中安装云监控服务Agent插件,用户可以实时采集ECS或BMS 1分钟级粒度的监控数据。已上线CPU、内存和磁盘等40余种监控指标。有关主机监控的更多信息,请参阅主机监控简介。
在“任务中心”页面的“Agent维护”页签可以查看安装、配置与升级Agent的任务信息。 对于Agent升级的任务,若“任务状态”为“成功”,可通过操作列的“回退”将当前的任务插件将回退到原版本;若“任务状态”为“超时”,可通过操作列的“重试”重新执行该任务。 图7 Agent维护 父主题: 云资源监控
prometheus更好地监控和分析来自 Cloudeye服务的数据。 Grafana是一个开源的可视化和分析平台,支持多种数据源,提供多种面板、插件来快速将复杂的数据转换为漂亮的图形和可视化的工具。将华为云Cloudeye服务接入prometheus后,您可以利用Grafana更好地分