检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云监控插件(Agent) Agent安装配置方式说明 Agent版本特性 Agent安装说明 安装配置Agent 管理Agent 其他插件安装说明 升级Agent 父主题: 主机监控
接入Prometheus/Grafana 安装配置CES Exporter 将监控数据导出到自建Prometheus/Grafana 父主题: 接入中心
该指标用于统计测量对象当前CPU使用率。 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu使用率。用户可以通过top命令查看 %Cpu(s)值。 采集方式(Windows):通过WindowsAPI GetSystemTimes获取 % 2.4.1 1分钟 cpu_usage_idle
在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则名称。 图4 配置告警规则名称 选择监控对象,配置告警触发条件。 图5 配置告警规则 配置“分组”参数时,选择在操作步骤1-创建资源分组中创建的“开发组资源”。 根据界面提示,配置告警通知参数。 图6 配置告警通知 注意,配置“通知对
Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 服务器内部时间和本地标准时间不一致。
配置云服务器全部挂载点磁盘使用率告警规则 场景描述 云监控服务提供了配置云服务器全部挂载点告警规则的能力。本章节介绍了配置云服务器全部挂载点磁盘使用率告警规则的操作流程。 磁盘使用率指标调整为挂载点维度,在新配置磁盘使用率告警规则时需要选择“云服务器挂载点”维度。 如果选择了配置
Agent插件状态显示“运行中”但没有数据该如何处理? Agent一键修复后无监控数据问题排查(老版本Agent) 如何获取Agent的Debug日志? Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 监控数据中会出现跳点的情况 入网带宽和出网带宽出现负值
修改prometheus中的prometheus.yml文件配置。如下配置所示在scrape_configs下新增job_name名为“huaweicloud”的节点。其中targets中配置的是访问cloudeye-exporter服务的ip地址和端口号,services配置的是你想要监控的服务,比如SYS
插件名称,不传查所有插件,目前仅支持telescope 枚举值: telescope extension_status 否 String 插件状态,不传查所有状态, none未安装,running运行中,stopped已停止,fault故障(进程异常),unknown故障(连接异常) 枚举值: none running
正则匹配:^([0-9A-Za-z]){1}([0-9A-Za-z]|_|-)*$ invocation_type 否 String 任务类型, INSTALL安装, UPDATE升级, ROLLBACK回退,RETRY重试 枚举值: INSTALL UPDATE ROLLBACK RETRY invocation_target
"unknown" }] } 案例三 ECS实例未安装agent插件 在CES页面“主机监控”下的【弹性云服务器】中找到对应ECS的实例,在【插件状态】列点击,未安装,然后根据使用指南安装agent插件。 案例四 ECS实例安装的agent插件没有上报磁盘使用率指标数据 agen
发布区域:以控制台实际上线区域为准 Agent支持的系统都有哪些? 安装Agent 站点监控 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。其提供简单的添加配置,不再浪费资源和精力配置复杂的开源产品。并且支持站点异常告警,不用担心网站出问题而无人知晓。
主机监控: 通过在弹性云服务器或裸金属服务器中安装云监控服务Agent插件,用户可以实时采集ECS或BMS 1分钟级粒度的监控数据。已上线CPU、内存和磁盘等40余种监控指标。有关主机监控的更多信息,请参阅主机监控简介。 灵活配置告警规则: 对监控指标设置告警规则时,支持对多个
主机id列表(INSTALL和UPDATE时必须) 数组长度:1 - 100 invocation_type 是 String 任务类型,INSTALL 安装,UPDATE升级,ROLLBACK回退,RETRY重试 枚举值: INSTALL UPDATE ROLLBACK RETRY invocation_target
主题订阅:通过在消息通知服务(SMN)配置的主题,快速将该消息推送至消息主题。 通知配置模块如下图所示。 通知策略模块如下图所示。 监控最核心的职责是帮助用户发现问题,而问题的发现是依赖监控系统中对告警规则的配置,告警规则配置的覆盖率、准确率将直接影响监控系统的故障发现率。 父主题: 告警配置方式
Key:proc Value:进程 弹性云服务器操作系统监控的监控指标(安装Agent) 裸金属服务器 SERVICE.BMS Key:instance_id Value:云服务器ID 裸金属服务器操作系统监控的监控指标(安装Agent) 弹性伸缩 SYS.AS Key:AutoScalingGroup
Key:davp Value:DAVP 弹性云服务器操作系统监控的监控指标(安装Agent) 裸金属服务器 SERVICE.BMS Key:instance_id Value:云服务器ID 裸金属服务器操作系统监控的监控指标(安装Agent) 弹性伸缩 SYS.AS Key:AutoScalingGroup
部分云服务的资源查询权限,如在使用中遇到权限问题,需要配置涉及服务的细粒度授权特性,才可以正常使用,支持细粒度授权的云服务列表请参考: 使用IAM授权的云服务。 告警通知:依赖SMN服务的SMN FullAccess。 配置数据转储:依赖OBS服务的OBS OperateAccess。
在“云服务监控”页面,勾选需要“配置数据存储”的云服务资源,单击“批量配置数据存储”,进入“批量配置数据存储”页面。 或在“主机监控”页面,勾选需要“配置数据存储”弹性云服务器,单击“批量配置数据存储”,进入“批量配置数据存储”页面。 在“配置数据存储”或“批量配置数据存储”页面,按照表1配置参数: 表1
告警配置方式 配置指标告警