检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
企业项目的子用户无法看到一键告警功能 云监控服务的一键告警功能只有主账号或配置了Tenant Administrator权限的子用户才有权访问和使用。 如何为子账号设置Tenant Administrator权限,请参考创建用户组并授权。 父主题: 告警
当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。 Windo
主机id 正则匹配:^[a-zA-Z0-9-]{1,64}$ instance_type 否 String 主机类型,ECS弹性云服务器,BMS裸金属服务器 枚举值: ECS BMS invocation_id 否 String 任务id 正则匹配:^([0-9A-Za-z]){1}([0-9A-Za-z]|_|-)*$
告警 告警简介 告警规则 告警记录 告警模板 告警通知 应用示例:用户自定义创建弹性云服务器CPU利用率告警 一键告警 告警屏蔽
告警记录”,进入“告警记录”界面。 在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“查看监控详情”,右侧弹出监控详情页面,用户可查看资源的基本信息和最近一次告警状态改变数据。 图1 查看监控详情 在“告警记录”列表右上角可选择日历,查看近30天内的任意时间段内的告警记录。 在“告警记录”列表页面的
场景化实践案例 电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
本章节主要介绍如何在单台主机中手动安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 目前只支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。
云监控服务监控的资源类型。 取值样例:弹性云服务器。 维度 监控对象的范围。 各服务监控对象的维度值请参考监控指标说明页面的“监控指标”和“维度”表格中描述。 选择“所有维度”时,表示该服务的所有监控对象均会转储到分布式消息服务Kafka中。 选择“云服务器”时,表示仅该云服务器的监控指标会转储到分布式消息服务Kafka中。
业务端口被Agent占用该如何处理? 云监控服务的Agent插件会使用HTTP请求上报数据,使用过程中会随机占用动态端口,范围取自/proc/sys/net/ipv4/ip_local_port_range。若发现使用的业务端口与Agent使用的端口冲突,可以修改/proc/sy
原始采样数据实时上报,提供对云服务的实时监控,实时触发产生告警并通知用户。 监控可视化 云监控服务通过监控面板为用户提供丰富的图表展现形式,支持数据自动刷新以及指标对比查看,满足用户多场景下的监控数据可视化需求。 多种通知方式 通过在告警规则中开启消息通知,当云服务的状态变化触发告警规则设置的阈值时,系
Token的有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头中,从而通过身份认证,获得操作API的权限。T
2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30 云监控在视频直播中的应用上线。 2018-07-30
average:聚合周期内指标数据的平均值。 max:聚合周期内指标数据的最大值。 min:聚合周期内指标数据的最小值。 sum:聚合周期内指标数据的求和值。 variance:聚合周期内指标数据的方差。 comparison_operator String 告警阈值的比较条件,可以是>、=、<、>=、<=。
il,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。 最小长度:1 最大长度:64 dimensions Array of Dimension objects 指标维度,目前最大可添加4个维度。
表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。 period Integer 指标周期,单位是秒; 0是默认值,例如事件类告警该字段就用0即可; 1代表指标的原始周期
4命令采集。 内存的设备信息 内存条的SN、厂商、PN、位宽、容量、频率等。 使用dmidecode -t 17命令采集。 CPU的设备信息 CPU的ID、名称、频率、架构、型号等。 使用dmidecode -t 4和lscpu命令采集。 内存的错误记录 内存的CE/UCE错误记
在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致; 已触发:监控的资源触发了告警策略中配置的事件; 已失效:告警规则中监控的资源或告警策略有调整,原有的告警记录状态失效。 父主题:
stall.sh 用户可手动卸载Agent插件,卸载后云监控服务将不再主动采集主机的监控数据。如需再次使用,请参考操作步骤或操作步骤重新安装。 查看Agent状态(老版本) 以root用户登录ECS或BMS,执行以下命令,查看Agent状态。 service telescoped
关联模板:当同一个云产品下多组资源需要配置相同的告警规则时,使用告警模板可省去手动重复配置的过程。 模板 当触发规则选择关联模板时,需要选择导入的模板。 您可以选择系统预置的默认告警模板,或者选择自定义模板。 事件名称 用户操作资源的动作,如用户登录,用户登出,为一个瞬间的操作动作。 事件监控支持的操作事件请参见事件监控支持的事件说明。
metric_name String 指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 resource_group_id String 创建告警规则时选择的资源分组ID,如:rg1603786526428bWbVmk4rP