检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Linux 当老架构的Agent不满足使用需求时,可以对Agent进行升级。云监控插件将不断升级版本,以便给您带来更好的监控体验。本章节主要介绍如何在Linux操作系统上将老架构的Agent升级到新架构Agent。 约束限制 不支持局点:华南-广州-友好用户环境、拉美-圣保罗一、拉美-墨西哥城一。
Windows 当老架构的Agent不满足使用需求时,可以对Agent进行升级。云监控插件将不断升级版本,以便给您带来更好的监控体验。本章节主要介绍如何在Windows操作系统上将老架构的Agent升级到新架构Agent。 约束限制 不支持局点:华南-广州-友好用户环境、拉美-圣保罗一、拉美-墨西哥城一。
资源类型 云监控服务监控的资源类型。 取值样例:弹性云服务器。 维度 监控对象的范围。 各服务监控对象的维度值请参考监控指标说明页面的“监控指标”和“维度”表格中描述。 选择“所有维度”时,表示该服务的所有监控对象均会转储到分布式消息服务Kafka中。 选择“云服务器”时,表示仅该云
通知策略名称。 告警级别 根据告警的严重程度不同等级,可选择紧急、重要、次要、提示。 通知类型 可选择触发或恢复,或者两者都选。 接收对象 需要发送告警通知的对象,可选择通知组或主题订阅两种方式。 当选择通知组时,请选择已有通知组,或单击“创建通知组”重新创建。 当选择主题订阅时,请选择
在弹出的“导出告警规则”界面填写任务名称,勾选需要的字段,选择是否导出指定资源列表,单击“确定”。 图1 导出告警规则 您要导出的数据中,包含指定资源的监控对象,您可以按需选择是否导出指定资源列表。 导出任务提交成功后,单击“任务中心”,在“告警数据导出”页签中的“告警规则导出”页面查看及下载。 图2
数如表1所示。 表1 配置参数 参数 参数说明 名称 屏蔽规则的名称。 选择对象 选择要屏蔽的对象。 说明: 单次最多可添加100个该服务的资源。 选择策略屏蔽时,需要先选择规则和选择策略后,再选择对象。 选择指标 仅当屏蔽方式为资源屏蔽时,可选择需要屏蔽告警的指标。 说明: 如果不指定指标,则对所有指标生效。
Agent安装配置方式说明 安装Agent方式有如下几种,你可以根据你所使用的服务的操作系统类型、是否有多个服务器以及个人习惯选择任何一种或多种安装方式: 安装场景 支持的服务 参考章节 控制台界面安装/升级Agent ECS 在控制台界面安装/升级Agent 安装Agent(Linux)
配置告警规则名称 选择监控对象,配置告警触发条件。 图5 配置告警规则 配置“分组”参数时,选择在操作步骤1-创建资源分组中创建的“开发组资源”。 根据界面提示,配置告警通知参数。 图6 配置告警通知 注意,配置“通知对象”参数时,选择在操作步骤2-创建主题并配置通知对象中创建的“Mytopic”。
在控制台界面安装/升级Agent 本章节主要介绍如何在主机监控页面为弹性云服务器一键安装/升级Agent插件,为用户提供更加便捷的安装方式,请根据需要选择合适的安装方式。支持Agent一键安装的系统请参考Agent支持的系统有哪些? 表1 适用场景 安装方式 适用场景 安装&升级插件
关机。 资源购买时间不足10分钟。 无数据上报的服务在云服务监控页面默认1~3小时内不显示,部分服务(例如API调用服务,API网关服务,对象存储服务,函数工作流服务,API网关专享版服务)会在云服务监控页面保留七天后不再显示。 父主题: 云服务监控
关机。 资源购买时间不足10分钟。 无数据上报的服务在云服务监控页面默认1~3小时内不显示,部分服务(例如API调用服务,API网关服务,对象存储服务,函数工作流服务,API网关专享版服务)会在云服务监控页面保留七天后不再显示。 父主题: 云服务监控
服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资源都会自动获得此授权。本节针对本授权做以下说明: 授权对象: 当您在云监控服务管理控制台“主机监控 > 弹性云服务器”(或“主机监控 > 裸金属服务器”)所示页面单击“一键配置”后,系统会在IAM
单击页面左侧的“主机监控”,进入主机监控页面。 单击ECS主机所在栏右侧的“更多”按钮,选择下拉出的“创建告警规则”。 在“创建告警规则”界面,根据界面提示配置参数。 监控对象为当前的ECS,无需配置。 选择监控指标,选择“自定义创建”,参照配置参数说明完成参数配置。 以CPU使用率为例,由于需要给服务器预留部分
服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资源都会自动获得此授权。本节针对本授权做以下说明: 授权对象: 当您在云监控服务管理控制台“主机监控 > 弹性云服务器”(或“主机监控 > 裸金属服务器”)所示页面单击“一键配置”后,系统会在IAM
资源分组 一套完整的电商平台会使用到ECS、CDN、AS、安全服务、RDS、OBS、VPC等服务,您可以创建资源分组,将电商业务的ECS、EIP、EVS等资源划分成一个分组,通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。
使用资源分组 应用场景 业务视角管理资源 使用资源分组,方便用户将云账户下各类资源按业务分类,从业务角度出发查询监控与告警信息。 日常巡检与故障快速定位 资源分组提供资源概览、不健康资源列表、告警规则、告警记录等功能。方便用户查看云资源使用情况,收到报警后迅速定位故障资源与故障原因。
各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 电商业务主要涉及ECS、CDN、AS、安全服务、RDS、ELB、OBS等服务。通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。 父主题: 电商平台业务监控
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件
基础监控与操作系统监控数据出现不一致的问题 现象 基础监控显示CPU使用率90%以上,接近100%,操作系统内监控的CPU使用率不到50%,两者相差较大。 原因 如果您在操作系统(Guest OS)中配置idle=poll,当操作系统内部空闲时,进入polling状态消耗计算资源
使用事件监控 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控,并在事件发生时进行告警。 事件即云监控保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。