检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Agent运行在弹性云服务器或裸金属服务器内,该Agent采集监控数据后需要上报到云监控服务,授权后CES Agent能够自动获取临时AK/SK,这样您就可以安全方便的使用云监控服务管理控制台或API查询Agent监控数据指标了。 安全:Agent使用的AK/SK仅具有CES Age
通过“自定义时间段”选择查看近六个月内任意时间段的历史监控数据。 图3 (Agent)CPU使用率 可在页面左上方选择不同的“周期”,对监控数据的聚合方法进行更改。 “近1小时”、“近3小时”、“近12小时”、“近24小时”的监控数据:系统默认显示原始数据。 “近7天”、“近30
单击资源分组列表中的其中一个分组名,进入分组资源概览界面。 图1 资源概览 在该页面中,可修改资源分组的名称,修改资源匹配规则,资源可进行移除操作和设置告警规则。 父主题: 查看资源分组
创建的资源分组选择一个或者多个资源。 详细参数说明请参见表3。 表3 resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dimensions Arrays of
恢复告警记录。 约束与限制 告警状态为告警中、已触发或数据不足时,可手动恢复告警记录。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警记录”,进入“告警记录”界面。 在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“手动恢复”。 弹出确定手动恢复的对话框。
请求Body参数 参数 是否必选 参数类型 描述 notification_mask_ids 是 Array of strings 关联编号 数组长度:1 - 100 mask_type 是 String 屏蔽类型。START_END_TIME:按起止时间屏蔽,FOREVER_TIM
nt暂时停止工作,不上报监控数据。 熔断机制原理 默认情况下,Agent检测机制为: 1分钟查检测一次Agent是否超过第二阈值(占用CPU超过30%或占用内存超过700M)。如果CPU或内存任何一个超出,Agent直接退出:如果没有超过第二阈值,查看Agent是否超过第一阈值(
Agent插件上报的监控指标。 步骤二:查看主机监控指标 查看主机关键指标的监控数据 步骤三:为主机监控创建告警规则 为特定的监控指标设置自定义告警规则。 步骤四:查看主机告警记录 当监控指标触发用户设置的告警条件时,云监控服务使用消息通知服务向用户通知告警信息,也可以在告警记录中查看告警信息。 后续操作:屏蔽告警规则
步骤三:查看监控视图 监控视图添加完成后,您可以在我的看板页面查看该监控项的监控走势图。系统提供固定时长和自定义时长两种方式查看监控走势图。 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“我的看板 > 自定义监控看板”。 单击需要查看监控视图的看板名称,查看我的看板下的所有监控视图。
查看分组列表 资源分组列表展示用户在云监控服务拥有的全部资源分组及各个分组的资源和健康度概况。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“资源分组”,进入“资源分组”页面。 在“资源分组”页面可以查看用户创
时间范围:可选择查询最近七天内任意时间段的操作事件。 选择完查询条件后,单击“查询”。 在需要查看的记录左侧,单击展开该记录的详细信息,展开记录如图1所示。 图1 展开记录 在需要查看的记录右侧,单击“查看事件”,弹出一个窗口,如图2所示,显示了该操作事件结构的详细信息。 图2 查看事件的详细日志信息
、24小时共五种聚合周期。 监控面板 监控面板为用户提供自定义查看监控数据的功能,支持在一个监控面板跨服务、跨维度查看监控数据,将您关注的重点服务监控指标集中呈现,既能满足总览服务运行概况,又能满足排查故障时快速查看监控详情的需求。 主题 主题是消息通知服务中消息发布或客户端订阅
Array of ResourceGroupTagRelation objects 标签动态匹配时的关联标签,type为TAG时该字段不为空 数组长度:1 - 10 表4 ResourceGroupTagRelation 参数 是否必选 参数类型 描述 key 是 String 键 最小长度:1
问题现象 已经配置了CBR等服务的5分钟聚合指标告警规则,连续3次触发则告警。实际却无法触发告警。 问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值, 因此无法触发告警。 父主题: 告警
云服务监控 电商平台RDS、ELB、VPC等服务,可以使用云服务监控,在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。
(资源类型) - 监控指标: 数据。这种情况下,假设当CPU利用率为10%时,监控视图会展示:ECS01(弹性云服务器)-CPU使用率:10%。 单击“确定”,完成监控视图的添加。 在所选的监控看板上可以查看新添加监控视图的监控走势图,单击,可放大查看详细的指标对比数据。 父主题: 监控看板(旧版)
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
从控制台获取项目ID的步骤如下: 登录管理控制台。 鼠标悬停在右上角的用户名,选择下拉列表中的“我的凭证”。 在“API凭证”页面的项目列表中查看项目ID。 图1 查看项目ID 父主题: 公共参数
用于从OBS桶下载Agent包到ECS或BMS中、获取ECS或BMS的元数据信息与鉴权信息。 1 允许 IPv4 TCP 53 100.125.0.0/16 用于DNS解析域名,下载Agent时解析OBS地址、发送监控数据时解析云监控服务Endpoint地址。 1 允许 IPv4 UDP
告警记录”,进入“告警记录”界面。 在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“查看监控详情”,右侧弹出监控详情页面,用户可查看资源的基本信息和最近一次告警状态改变数据。 图1 查看监控详情 在“告警记录”列表右上角可选择日历,查看近30天内的任意时间段内的告警记录。 在“