检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ADVANCE_VERSION”表示升级成增强版本 枚举值: BASIC_VERSION ADVANCE_VERSION origin 否 String Agent任务接口调用源,CES表示由Console调用,APICOM_BMS表示由裸金属服务器调用,ADMIN_SERVER表示由运维平台调用
安装云专线指标采集插件 云专线插件是用于检测云专线端到端的网络质量的插件,主要包含网络时延和丢包率两个指标。 云专线插件分为两种: dc-nqa-collector:用于监控自动化专线,探测远端子网的时延和丢包率。 history-dc-nqa-collector:用于监控手工专线
入网带宽和出网带宽出现负值 老版本Agent在统计出入网带宽时,如若装有docker,当容器重启时无法统计虚拟网卡值,由于计算的是差值而导致出现负值的情况。 请参照管理Agent更新Agent。 父主题: 主机监控
事件监控简介 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。事件监控不依赖于Agent插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作
云监控服务平台提供了为ECS或BMS的监控指标创建告警规则的快捷入口。本步骤仅针对本示例进行参数设置及介绍,更多创建主机监控告警规则请参见“创建主机监控的告警通知” 在主机监控页面的“操作”列,单击“创建告警规则”直接对单台资源配置告警规则。
带外网络流出流入速率是什么含义? 概念 带外网络流出速率和带外网络流入速率这两个监控指标主要涉及两个概念: 带外 带外:带外相对于带内。在云服务器中,“带内”表示监控的测量对象是弹性云服务器。“带外”表示监控的测量对象是虚拟化层面的物理服务器。 流入和流出 流入:表示以弹性云服务器为主体
Agent一键修复失败问题排查 问题现象 安装主机监控Agent后,单击“修复插件配置”后,插件状态仍然是“配置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr
资源分组支持的云服务 由于智能创建资源分组的能力依赖云服务对接config资源管理服务,可能存在部分云服务在某些region未对接config的情况,具体支持情况可在页面配置资源分组时查看确认。 云服务 英文简称 产品 手动添加 企业项目 标签 实例名称 组合匹配 弹性云服务器 ECS
如何配置DNS和安全组? 本章节指导用户为Linux系统的主机添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,其他主机步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置
一键告警 一键告警为您提供针对服务下所有资源快速开启告警的能力,旨在帮助用户快速建立监控告警体系,在资源异常时可以及时获得通知。本章节介绍如何使用一键告警功能一键开启关键监控项告警的服务。 一键式告警和普通告警的主要差异点如表1所示。 表1 一键告警和告警对比一览表 告警类型 主要目标
事件监控支持的事件说明 表1 弹性云服务器 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 ECS SYS.ECS 因系统故障触发重部署 startAutoRecovery 重要 弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机
事件监控支持的事件说明 表1 弹性云服务器 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 ECS SYS.ECS 因系统故障触发重部署 startAutoRecovery 重要 弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机
创建事件监控的告警通知 操作场景 当您需要关注核心事件时,通过为指定的事件创建告警规则及告警通知,可以及时收到告警信息,进行异常处理或业务切换。本章节指导用户针对事件监控创建告警规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“事件监控”。 在事件列表页面
创建主机监控的告警通知 当您需要监控各云产品资源的使用情况时,可以创建告警规则并配置告警通知。如果资源的监控指标触发设定的阈值,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。本章节指导用户对ECS或BMS的监控指标创建告警规则。 操作步骤 登录管理控制台
安装配置CES Exporter Prometheus是用于展示大型测量数据的开源可视化工具,在工业监控、气象监控、家居自动化和过程管理等领域也有着较广泛的用户基础。将华为云Cloud Eye服务接入Prometheus后,您可以利用Prometheus更好地监控和分析来自Cloud
文档修订记录 发布日期 修改记录 2023-10-12 第四十六次正式发布: 本次变更如下: 新增告警通知。 新增一键告警。 新增告警通知屏蔽。 新增CES资源标签管理。 2023-08-31 第四十五次正式发布: 本次变更如下: 新增监控看板。 新增监控视图。 新增插件状态查询。
创建告警规则和通知 当您需要监控各云服务资源的使用情况或云服务资源的关键操作时,可以创建告警规则。告警规则添加完成后,当监控指标触发设定的阈值或者事件发生时,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。 本章节指导用户如何创建告警规则。 创建告警规则
Agent支持的指标列表 操作系统指标: CPU 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) cpu_usage (Agent)CPU使用率 该指标用于统计测量对象当前CPU使用率。 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu