检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
站点的访问情况。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“站点监控”。 进入“站点监控”界面。 系统展示用户当前所有站点概况。包括站点名称、站点地址、探测类型、监控频率、可用探测点百分比、平均响应时间等。 单击站点名称所在行的“查看监控图表”。
ECS SYS.ECS 因系统故障触发重部署 startAutoRecovery 重要 弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,迁移过程中系统会自动重启云服务器。 等待虚拟机迁移成功,状态恢复正常。 实例重部署开始。 因系统故障重部署已完成 endAutoRecovery
支持。 “配置数据存储”保存到OBS中的功能即将下线,未配置OBS数据存储的用户请不要使用,避免数据丢失,推荐使用将云服务监控数据转储到分布式消息服务Kafka中,详情请查看数据转储。 前提条件 已开启云服务。 已开通对象存储服务。 操作步骤 登录管理控制台。 单击“服务列表 >
添加监控数据 功能介绍 添加一条或多条自定义指标监控数据,解决系统监控指标不能满足具体业务需求的场景。 监控数据保留时间请参见《云监控服务用户指南》的“指标数据保留多长时间”章节。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以
搭建业务的系统级监控。 本文介绍云监控服务常用最佳实践,帮助您更好的使用云监控服务。 表1 常用最佳实践 实践 描述 电商平台 电商平台最佳实践 电商业务对内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。
扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性,并且使用云监控的事件监控功能对服务器运行异常及自动恢复进行监控,订阅事件告警同步进行业务处理。 表1 ECS重点事件 事件名称 事件说明 处理步骤 因硬件故障触发重启 弹性云服务器所在的主机出现故障时,系统会自动将
批量安装Agent 操作场景 本章节主要介绍如何批量安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 批量安装不支持跨区域执行。 批量安装的主机需同属一个VPC。 Windows版本暂不支持批量安装Agent。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。
在“告警模板”界面,单击“创建自定义模板”。 在“创建自定义告警模板”界面,参考表1进行参数配置。 图1 创建自定义告警模板 表1 配置参数 参数 参数说明 名称 系统会随机产生一个模板名称,用户也可以进行修改。 取值样例:alarmTemplate-c6ft 描述 自定义告警模板描述(此参数非必填项)。
服务器-磁盘策略,则不会自动同步。 模板 当告警类型选择指标且触发规则选择关联模板时,或告警类型选择事件且事件类型为系统事件时,需要选择导入的模板。 您可以选择系统预置的默认告警模板,或者选择自定义模板。 事件名称 用户操作资源的动作,如用户登录,用户登出,为一个瞬间的操作动作。
式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资源都会自动获得此授权。本节针对本授权做以下说明:
式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资源都会自动获得此授权。本节针对本授权做以下说明:
Agent版本特性 CES Agent支持的镜像列表,参见 Agent支持的系统有哪些? CES Agent迭代版本已知版本特性如下: 2.7.2.1版本 基于2.7.2版本: 增加GPU指标。 增加NPU指标。 增加物理机硬件监控能力。详情说明参考BMS硬件监控插件说明。 2.7
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保
否 事件类型,值为EVENT.SYS或EVENT.CUSTOM。EVENT.SYS表示系统事件,EVENT.CUSTOM表示自定义事件。 event_name String 否 事件名称,值为系统产生的事件名称或用户自定义上报的事件名称。 from Integer 否 查询数据起始
Agent插件状态显示“故障”该如何处理? 操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
对比查看,满足用户多场景下的监控数据可视化需求。 多种通知方式 通过在告警规则中开启消息通知,当云服务的状态变化触发告警规则设置的阈值时,系统提供电话、短信、邮箱、企业微信、钉钉、飞书和Welink通知,还可以通过HTTP、HTTPS将告警信息发送至告警服务器,用户可以在第一时间
模板”,根据界面提示配置参数。 根据界面提示,配置告警通知内容模板的基本信息。 图1 基本信息 表1 基本信息 参数 参数说明 模板名称 系统会随机产生一个通知模板名称,用户也可以进行修改。 取值样例:noticeTemplate-d9wa 描述 告警通知模板描述(此参数非必填项)。
择磁盘挂载点。 安装Agent后,您可以在管理控制台查看数据盘的磁盘使用率。查看方法如下:在操作系统监控指标查看页面,选择“磁盘”页签,然后选择右侧的挂载点,如图1所示。 图1 在操作系统监控页面查看数据盘的磁盘使用率 父主题: 告警
本Agent) 问题现象 Agent一键修复后运行正常,但仍然没有监控数据。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败 网络问题 首先需要确认使用的Agent版本。
购买云服务资源后,在云监控服务查看不到监控数据 用户购买云服务资源后,首先需要确认该服务是否已对接云监控服务,系统正在对接更多的云服务,在此之前用户无法查看到未对接服务资源的监控数据。 如该服务已对接云监控服务,请耐心等待一段时间,由于各个服务采集上报监控数据的频率各有不同,当云