检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
怎样让新购ECS实例中带有操作系统监控功能? 操作场景 本章节指导用户如何让新购买的ECS实例带有操作系统监控功能。 制作的私有镜像不可跨Region使用,因为跨Region使用私有镜像创建的ECS实例无法取得监控数据。 前提条件 已有安装Agent的ECS实例。
基础监控与操作系统监控数据出现不一致的问题 现象 基础监控显示CPU使用率90%以上,接近100%,操作系统内监控的CPU使用率不到50%,两者相差较大。
为什么中文操作系统下安装了CES Agent后查看操作系统监控没有指标值? 问题描述 中文操作系统下安装了CES Agent后查看指标无内容,除中文操作系统外其他实例指标正常。
操作系统监控GPU页面显示无记录该如何处理? 在查看主机监控的监控指标时,如果出现操作系统监控GPU页面显示无记录的问题,请先确认您的机器是否支持GPU。
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 安装配置Agent成功,需要等待2分钟,管理控制台上才会有操作系统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。
操作记录审计 云监控服务通过云审计服务(Cloud Trace Service,简称CTS)为您提供云监控服务的操作记录,记录内容包括您从公有云管理控制台或者开放API发起的云监控服务操作请求以及每次请求的结果,供您查询、审计和回溯使用。
云审计服务支持的Cloud Eye操作列表 表1 云审计服务支持的Cloud Eye操作列表 操作名称 资源类型 事件名称 创建告警规则 alarm_rule createAlarmRule 删除告警规则 alarm_rule deleteAlarmRule 停用告警规则 alarm_rule
本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件: 操作步骤(单节点安装) 操作步骤(多节点批量安装) 约束与限制 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些?。
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。
查看云监控服务日志 操作场景 在您开启了云审计服务后,系统开始记录云监控资源的操作。云审计服务管理控制台保存最近7天的操作记录。 本节介绍如何在云审计服务管理控制台查看或导出最近7天的操作记录。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。
主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。
方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。事件监控不依赖于Agent插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。
图1 操作系统监控 查看ECS基础监控指标的方法:单击左侧导航栏的“主机监控 > 弹性云服务器”,再单击ECS实例所在行的“查看监控指标”,最后单击“操作系统监控”右侧的“基础监控”,如图2所示。
Linux操作系统安装插件需要root权限;Windows操作系统安装插件需要管理员权限。 约束限制 主机监控仅针对于华为云公共镜像提供监控服务,如您是私有镜像,使用过程中出现任何问题,CES将不对此提供技术支持。
状态码 正常 返回值 说明 200 OK GET和PUT操作正常返回。 201 Created POST操作正常返回。 202 Accepted 请求已被接受。 204 No Content DELETE操作正常返回。
授权重新部署到新主机操作。
返回版本号,表示使用新版本Agent,手动配置Agent操作请参考请使用操作步骤(新版本Agent)。 返回“0”,表示未安装Agent。 操作步骤(新版本Agent) 操作步骤(老版本Agent) 使用root账号,登录ECS。 修改bin目录下的配置文件conf.json。
问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败 网络问题 首先需要确认使用的Agent版本。 使用root账号,登录ECS。
删除自定义告警/事件模板 当您不再需要某个自定义告警/事件模板时,可以对其执行删除操作。删除操作无法恢复,请谨慎操作。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警模板”,进入告警模板界面。 单击“自定义告警模板”页签。
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控