检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口,双12、618等大型购物节
概览 无论您使用的是ECS还是BMS,都可以使用主机监控来采集丰富的操作系统层面监控指标,也可以使用主机监控进行服务器资源使用情况监控和排查故障时的监控数据查询。 主机监控分为基础监控、操作系统监控和进程监控。 基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监
对于dim字段的内容,可通过调用查询指标列表接口,在其响应体的相关指标数据中获取。 对于OBS相关指标数据,当进行了相关OBS接口操作时可查询到相关指标数据,否则查询结果为空。 对于EVS相关指标数据,disk_name维度下,它的返回值有云服务器实例ID-盘符名和云服务器实例ID-volume-卷ID两种。
String 资源分组名称,支持模糊查询 最小长度:1 最大长度:128 group_id 否 String 资源分组ID,以rg开头,后跟22位由字母或数字组成的字符串 最小长度:2 最大长度:24 offset 否 Integer 分页查询时查询的起始位置,表示从第几条数据开始,默认为0
X-Auth-Token 是 String 用户Token。用户Token也就是调用获取用户Token接口的响应值,该接口是唯一不需要认证的接口。请求响应成功后在响应消息头中包含的“X-Subject-Token”的值即为Token值。 最小长度:1 最大长度:16000 响应参数 状态码: 200 表4
upwatch|ecsRecovery|contact|contactGroup|iecAction)$ notification_list Array of strings 告警状态发生变化时,被通知对象的列表。topicUrn可从SMN获取,具体操作请参考查询Topic列表。
主机监控进行服务器资源使用情况监控和排查故障时的监控数据查询。 基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监控CPU使用率等指标,详见支持监控的服务列表。 操作系统监控:通过在弹性云服务器或裸金属服务器中安装Agent插件,为用户提供服务器的系统级、主动式
表1 云服务器列表和分组规划 云服务器名称 分组 是否需要安装Agent 所属部门 ECS-01 开发组资源 是 开发项目组 ECS-02 开发组资源 是 开发项目组 ECS-03 无需分组 否 测试项目组 ECS-04 无需分组 否 测试项目组 前提条件 ECS01和ECS02已经
查询主机配置数据 功能介绍 查询指定时间范围指定事件类型的主机配置数据,可以通过参数指定需要查询的数据维度。 该接口提供给HANA场景下SAP Monitor查询主机配置数据,其他场景下查不到主机配置数据。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
查看主机监控的资源详情 本章节指导用户查看主机监控的资源详情。通过查看资源详情可以了解当前云资源的实例信息及资源分组信息。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“主机监控 > 弹性云服务器”。 单击需要查看资源详情的监控名称,进入“操作系统监控”界面。
查询监控数据 使用前常见问题 问题一 问题描述 GET /V1.0/{project_id}/metric-data 查询监控数据接口如何使用。 解决方法 参考查询监控数据接口文档:查询监控数据。 问题二 问题描述 调用不同region区域的接口,对应的域名是什么。 解决方法 参考文档:地区和终端节点。
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工
资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 from 否 查询告警历史的起始时间。UNIX时间戳,单位毫秒,如:1602501480905。from、to如果不进行赋值,则默认to是当前时间,from是当前时间减7天的时间戳。 to
据。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败 网络问题 首先需要确认使用的Agent版本。 使用root账号,登录ECS。 执行如下命令,确认使用老版本Agent。
网络正常:排查结束。 网络无法访问:修改DNS配置或CES的终端节点。 各区域对应的云监控服务的Endpoint请参考“地区和终端节点”。 问题解决(Windows) 以administrator权限用户登录弹性云服务器或裸金属服务器。 进入任务管理器,查看telescope进程是否存在。 当包括
载点名称的操作。 选择了配置云服务器全部挂载点的告警规则,后续该云服务器的新增挂载点会自动适配该告警规则。 商用 配置云服务器全部挂载点磁盘使用率告警规则 2021年02月 序号 功能名称 功能描述 阶段 相关文档 1 主机监控页面指标排序能力 在主机监控-弹性云服务器页面,您可
一个点,所以导致查询出来的指标数据量少于上报的数据量。 原因2:若上报指标周期与批量查询监控数据的监控周期相同,根据上面计算规则,最多返回的指标数据量为3000。 解决方法 将请求参数监控周期按照接口文档给出的枚举值选择小点的监控周期。 使用查询监控数据接口查询指标数据(仅支持单
涉及到的云服务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则,可以迅速提升运维效率。 购买了多种云产品的用户,通过资源分组功能将同一业务相关的云服务器、云硬盘、弹性IP、带宽、数据库等资源添加到同一资源分组中。在分组维度管理告警规则,查看监控数
连接各业务与数据库的各个基础接口。BMS与ECS的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控和事件监控随时监控ECS与BMS的运行状况。 网站与各个基础接口的可用性、响应时间、丢包率等会直接影响用户使用的流畅程度,需使用站点监控随时监控各站点的运行情况。