检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
(Windows):暂不支持。 % 2.5.6 1分钟 操作系统监控指标: 文件系统 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) disk_fs_rwstate (Agent)文件系统读写状态 该指标用于统计测量对象挂载文件系统的读写状态。状态分为:可读写(0)/只读(1)。
ECS SYS.ECS 因系统故障触发重部署 startAutoRecovery 重要 弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,迁移过程中系统会自动重启云服务器。 等待虚拟机迁移成功,状态恢复正常。 实例重部署开始。 因系统故障重部署已完成 endAutoRecovery
扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性,并且使用云监控的事件监控功能对服务器运行异常及自动恢复进行监控,订阅事件告警同步进行业务处理。 表1 ECS重点事件 事件名称 事件说明 处理步骤 因硬件故障触发重启 弹性云服务器所在的主机出现故障时,系统会自动将
Agent版本特性 CES Agent支持的镜像列表,参见 Agent支持的系统有哪些? CES Agent迭代版本已知版本特性如下: 2.7.2.1版本 基于2.7.2版本: 增加GPU指标。 增加NPU指标。 增加物理机硬件监控能力。详情说明参考BMS硬件监控插件说明。 2.7
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保
否 事件类型,值为EVENT.SYS或EVENT.CUSTOM。EVENT.SYS表示系统事件,EVENT.CUSTOM表示自定义事件。 event_name String 否 事件名称,值为系统产生的事件名称或用户自定义上报的事件名称。 from Integer 否 查询数据起始
本Agent) 问题现象 Agent一键修复后运行正常,但仍然没有监控数据。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败 网络问题 首先需要确认使用的Agent版本。
Agent插件状态显示“故障”该如何处理? 操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件 请保证线下环境与云监控网络互通。
查询指标列表 功能介绍 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
添加监控数据 功能介绍 添加一条或多条自定义指标监控数据,解决系统监控指标不能满足具体业务需求的场景。 监控数据保留时间请参见《云监控服务用户指南》的“指标数据保留多长时间”章节。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以
模板”,根据界面提示配置参数。 根据界面提示,配置告警通知内容模板的基本信息。 图1 基本信息 表1 基本信息 参数 参数说明 模板名称 系统会随机产生一个通知模板名称,用户也可以进行修改。 取值样例:noticeTemplate-d9wa 描述 告警通知模板描述(此参数非必填项)。
和文件配置。 当通过“修复插件配置”或其他原因无法完成Agent配置时,您还可以手工配置Agent。 支持安装Agent的操作系统请参见Agent支持的系统有哪些。 对于私有镜像,推荐您使用已安装Agent的ECS或BMS制作私有镜像,并使用该私有镜像创建ECS或BMS。 制作的
择磁盘挂载点。 安装Agent后,您可以在管理控制台查看数据盘的磁盘使用率。查看方法如下:在操作系统监控指标查看页面,选择“磁盘”页签,然后选择右侧的挂载点,如图1所示。 图1 在操作系统监控页面查看数据盘的磁盘使用率 父主题: 告警
您可以自主选择指标、图表类型来展现您关注的资源图表。 前提条件 请确保您拥有云监控服务的操作权限,并且可以创建自定义看板。 操作步骤 单击系统左侧主菜单“我的看板”,进入看板列表页面,单击“创建看板”创建您的看板。 看板创建完成后,单击看板名字进入。 进入看板页面后,您可以单击“
购买云服务资源后,在云监控服务查看不到监控数据 用户购买云服务资源后,首先需要确认该服务是否已对接云监控服务,系统正在对接更多的云服务,在此之前用户无法查看到未对接服务资源的监控数据。 如该服务已对接云监控服务,请耐心等待一段时间,由于各个服务采集上报监控数据的频率各有不同,当云
单击“服务列表 > 云监控服务”。 单击业务左侧导航栏的“事件监控”。 进入“事件监控”页面。在“事件监控”页面,默认展示近24小时的所有系统事件。 您也可以根据需要选择“近1小时”“近3小时”“近12小时”“近24小时”“近7天”“近30天”,分别查看不同时段的事件。 图1 事件监控
在“告警模板”界面,单击“创建自定义模板”。 在“创建自定义告警模板”界面,参考表1进行参数配置。 图1 创建自定义告警模板 表1 配置参数 参数 参数说明 名称 系统会随机产生一个模板名称,用户也可以进行修改。 取值样例:alarmTemplate-c6ft 描述 自定义告警模板描述(此参数非必填项)。
在“监控任务”页面,单击“创建任务”。 根据界面提示,配置广域网质量监控的基础信息。 图1 填写基础信息 表1 配置基本信息 参数 参数说明 取值样例 名称 系统会随机产生一个名称,用户也可以进行修改。 availabilityMonitor-wi4t 任务类型 目前可针对四种协议进行监控:HTTP(S)、PING、TCP、UDP。
预测值,则触发告警。 静态阈值 事件类型 当告警类型选择事件时,需要选择事件类型,可选择系统事件或自定义事件。 系统事件 事件来源 当告警类型选择事件时,需要设置事件来源。 当事件类型选择系统事件时,需要选择事件来源的云服务名称。 取值样例:弹性云服务器 当事件类型选择自定义事件