检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
和支持监控的服务列表,有助于您快速适配您的业务场景选择合适的资源监控方式和告警通知方式。 产品介绍 什么是云监控服务 云监控服务相关概念 支持监控的服务列表 服务优势 03 使用 为您全面展示华为云云监控服务的监控面板、主机监控Agent、告警规则和告警通知等功能的详细使用方法和步骤。
故障,避免因资源问题造成业务损失。 配置云服务器全部挂载点告警规则 配置云服务器全部挂载点磁盘使用率告警规则 云监控服务提供了配置云服务器全部挂载点告警规则的能力。磁盘使用率指标调整为挂载点维度,在新配置磁盘使用率告警规则时需要选择“云服务器挂载点”维度。
告警模板简介 告警模版是指在配置云服务资源的告警规则过程中,提前将监控指标配置成告警策略模版,以便在创建不同的告警规则时进行引用。 告警模版通常应用于当用户拥有多种云服务资源时,提前将这些资源的告警策略配置到一个或多个告警模版中,在配置告警规则时直接引用。对于使用模版创建的告警规则,可直接在
告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致; 已触发:监控的资源触发了告警策略中配置的事件; 已失效:告警规则中监控的资源或告警策略有调整,原有的告警记录状态失效。
根据需要可选择通知组或主题订阅两种方式。 通知组 需要发送告警通知的通知组。创建通知组请参见创建通知对象/通知组。 通知对象 需要发送告警通知的对象,可选择云账号联系人或主题名称。 云账号联系人为注册时的手机和邮箱。 主题是消息发布或客户端订阅通知的特定事件类型,若此处没有需要的主题则需先创建主题并添加订阅,创
单击状态为“已关闭”的数据转储所在行“操作”列的“启用”,在弹出的“启用转储任务”界面,单击“确定”。 勾选需要启用的数据转储任务所在行前的勾选框,单击“数据转储”界面的“启用”,在弹出的“启用转储任务”界面,单击“确定”。 删除数据转储任务 删除转储任务后,采集的监控数据将不再进行转储,已经转储的数据不会丢失。
在“告警规则”界面,单击待修改告警规则所在行“操作”列的“修改”按钮; 在“告警规则”界面,选择待修改告警规则名称,进入告警规则详情页面,单击右上角“修改”。 在弹出的“修改告警规则”页面中修改告警规则配置参数。 修改告警规则时,告警类型、云产品、资源层级和监控范围的参数为默认值,不可修改,若监控范围
namespace 是 String 创建自定义告警模板选择的资源类型,即服务命名空间,如选择弹性云服务器,则命名空间为SYS.ECS。 dimension_name 是 String 资源类型对应的指标监控维度,选择弹性云服务器,则维度为云服务器,dimension_name值为instance_id。
在“修改屏蔽规则”界面,根据界面提示配置参数,参数如表1所示。 表1 配置参数 参数 参数说明 名称 屏蔽规则的名称。 选择对象 选择要屏蔽的对象。 说明: 单次最多可添加100个该服务的资源。 选择策略屏蔽时,需要先选择规则和选择策略后,再选择对象。 选择指标 仅当屏蔽方式为资源屏蔽时,可选择需要屏蔽告警的指标。
指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 表5 dimensions字段数据结构说明 名称 是否必选 参数类型 说明 name 是 String 监控维度名称,例如弹性云服务器的维度为in
主机监控进行服务器资源使用情况监控和排查故障时的监控数据查询。 基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监控CPU使用率等指标,详见支持监控的服务列表。 操作系统监控:通过在弹性云服务器或裸金属服务器中安装Agent插件,为用户提供服务器的系统级、主动式
根据界面提示,配置告警通知参数,具体参数配置请参见表2。 图2 配置告警通知 “告警通知”功能触发产生的告警消息由消息通知服务SMN发送,可能产生少量费用,具体费用请参考产品价格说明。 根据界面提示,配置归属企业项目。 图3 高级配置 表1 配置归属企业项目 参数 参数说明 归属企业项目 告警规则所属的企业项目
主机监控Agent对主机的性能会有影响吗? 主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下:
云监控服务监控的资源类型。 取值样例:弹性云服务器。 维度 监控对象的范围。 各服务监控对象的维度值请参考监控指标说明页面的“监控指标”和“维度”表格中描述。 选择“所有维度”时,表示该服务的所有监控对象均会转储到分布式消息服务Kafka中。 选择“云服务器”时,表示仅该云服务器的监控指标会转储到分布式消息服务Kafka中。
是 创建的资源分组选择一个或者多个资源。 详细参数说明请参见表3。 表3 resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。
而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内存使用率等。监控指标是与时间有关的变量值,会随着时间的变化产生一
创建我的看板 用户添加监控视图之前,需要先创建我的看板。目前云监控服务支持创建20个我的看板,满足您对云服务运行情况不同的监控需求。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“我的看板 > 自定义监控看板”,单击“创建看板”。 系统弹出“创建看板”窗口。
在“通知策略”页签,单击待修改的通知策略所在行“操作”列的“修改”。 进入“修改通知策略”界面。 在“概况”页面,修改已配置的参数。 在“关联告警规则”页面,可选择一个或多个要解绑的告警规则,单击“解绑”。 图2 修改通知策略 单击“确定”,完成通知策略的修改。 删除通知策略 登录管理控制台。