检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用站点监控 应用场景 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 站点监控可以探测域名、IP的可用性、访问响应时间、丢包率,并对监控结果告警。 创建站点监控 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“站点监控”,进入“站点监控”页面。
主机监控分为基础监控、操作系统监控和进程监控。无论您使用的是弹性云服务器还是裸金属服务器,都可以使用主机监控来采集丰富的操作系统层面监控指标,也可以使用主机监控进行服务器资源使用情况监控和排查故障时的监控数据查询。 基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监控
式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资源都会自动获得此授权。本节针对本授权做以下说明:
式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资源都会自动获得此授权。本节针对本授权做以下说明:
主机监控 针对众包平台中使用的ECS和BMS,ECS作为业务的计算资源,数据库部署在BMS上。因此,BMS的磁盘速度会影响数据库操作速度,ECS的内存和CPU占用大小等会影响业务执行速度,为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 具体监控指标方面,可
返回“0”,表示未安装Agent。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 网络问题 问题解决(Linux) 以root用户登录弹性云服务器或裸金属服务器。 执行如下命令,检查telescope进程是否存在:
t插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。 事件
监控视图关联的企业项目,只有有企业项目的权限,才有权查看此监控视图的监控数据。 资源类型 所关注指标对应的服务名称。 取值样例:弹性云服务器 维度 所关注指标的维度名称。 取值样例:云服务器 监控对象 所关注指标对应的监控对象,数量上限为50个。 可支持一次勾选多个监控对象。 监控指标 所关注指标的名称。
1版本后集成了物理机硬件监控插件,通过实时巡检发现硬件的亚健康状态,提前规避故障风险,为BMS实例提供全面硬件故障监控能力。 物理机硬件监控插件只针对BMS实例生效,其他云服务器不受其影响。 BMS实例缺失硬件监控插件会导致华为云无法第一时间感知实例的硬件故障,可能影响业务可用性时长,且故障需要用户主动联系技术支持处理。
ule,health表示健康。 namespace 否 资源命名空间,例如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dname 否 资源维度,例如弹性云服务器维度为:instance_id,各资源的维度可查看支持监控的服务列表。 start
有多个服务器以及个人习惯选择任何一种或多种安装方式: 安装场景 支持的服务 参考章节 控制台界面安装/升级Agent ECS 在控制台界面安装/升级Agent 安装Agent(Linux) ECS、BMS 单台主机下安装Agent 安装Agent(Windows) ECS 安装Agent(Windows)
测试组下的两台弹性云服务器不需要获取其运行状态。 表1 云服务器列表和分组规划 云服务器名称 分组 是否需要安装Agent 所属部门 ECS-01 开发组资源 是 开发项目组 ECS-02 开发组资源 是 开发项目组 ECS-03 无需分组 否 测试项目组 ECS-04 无需分组
当前支持的监控类型:HTTP、HTTPS、PING、TCP、UDP。 应用场景 广域网质量监控主要用于发送模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 服务可用性监控 通过使用广域网功能配置定时HTTP(S)拨测任务,选择分布在全球的探测点对域名进行
站点监控简介 应用场景 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 首期支持华北(廊坊)、华东(上海)、华南(广州)、西南(贵阳)、华南(深圳)五个探测点实时监控网站,后续探测点和能力不再演进,如有诉求请使用广域网质量监控,具体操作请参见广域网质量监控(公测)。
collect_time 是 Long 数据收集时间 UNIX时间戳,单位毫秒。 说明: 因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-3天+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 value 是 Double 待添加的监控指标数据的值。
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
目前大部分区域已上线一键式授予该区域插件权限功能,即自动修复插件配置。您可以单击“主机监控 - 弹性云服务器”页面上方的“一键配置”开启该区域插件权限。配置完成后此区域所有服务器均默认修复插件配置,后续不再显示“一键配置”按钮。若提示租户权限不足,请参考主机监控界面单击一键配置
resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dimensions Arrays of objects 是 一个或者多个资源维度。
或使用其他ntp服务器替换ntp.myhuaweicloud.com 修复方法(Windows) 使用administrator登录,确认当前主机ntp服务正常。进入控制面板->日期和时间->设置日期和时间->Internal时间->更改设置 输入对应的ntp服务器,比如ntp.myhuaweicloud
障,避免因资源问题造成业务损失。 配置云服务器全部挂载点告警规则 配置云服务器全部挂载点磁盘使用率告警规则 云监控服务提供了配置云服务器全部挂载点告警规则的能力。磁盘使用率指标调整为挂载点维度,在新配置磁盘使用率告警规则时需要选择“云服务器挂载点”维度。