检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
事件监控简介 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。事件监控不依赖于Agent插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现在拆线图和条形图中完成监控指标的增加、修改、删除等日常操作。 曲线图的操作步骤 登录管理控制台。
事件监控 在实际的业务的运行中,ECS、BMS可随时根据业务调整,进行删除、重启、关闭、删除网卡、删除安全组等操作。因此,可以使用事件监控随时监控ECS、BMS的运行状态。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页
监控视图添加完成后,您可以在我的看板页面查看该监控项的监控走势图。系统提供固定时长和自定义时长两种方式查看监控走势图。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“我的看板 > 自定义监控看板”。 单击需要查看监控视图的看板名称,查看我的看板下的所有监控视图。 在监
数”的统计。 告警统计 该数据统计的是近7天状态为“告警中”的告警级别明细和资源分组告警。告警级别明细中包含对“紧急告警”、“重要告警”、“次要告警”和“提示告警”的统计。 关键指标 展示了产品自主推荐的关键指标的监控详情。 在云服务看板详情页面中,单击左上角的选择框,可选择资源
资源概览界面显示当前分组中包含的资源类型、每个类型下包含的资源总数、维度、资源告警状态。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“资源分组”,进入“资源分组”页面。 单击资源分组列表中的其中一个分组名,进入分组资源概览界面。
告警模板”,进入告警模板界面。 单击“自定义告警模板”或“自定义事件模板”页签。 单击待复制自定义模板所在行的操作列下的“更多 > 复制”。 在“复制模板”弹窗,填写“模板名称”和“描述”。 图1 复制自定义告警模板 单击“确定”即可复制该告警模板。 父主题: 告警模板
average:聚合周期内指标数据的平均值。 max:聚合周期内指标数据的最大值。 min:聚合周期内指标数据的最小值。 sum:聚合周期内指标数据的求和值。 variance:聚合周期内指标数据的方差。 comparison_operator String 告警阈值的比较条件,可以是>、=、<、>=、<=。
当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。 Windo
当告警触发后,我们需要定义通知的渠道和对象,快速的将告警信息通过配置的渠道通知到运维人员。 当前CES支持以下三种方式来完成通知的配置。 通知策略(推荐):产品最新上线能力,通过通知策略可以完成告警的分级通知、简易排班。 通知组:通过在云监控服务上配置的通知群组,可以快速通知到指定运维人员。
155天 “亚太-曼谷”的指标数据最长保留周期为一年,聚合周期为24小时。 若需要将数据保存更长时间,可对数据进行转储保存。具体操作请参考数据转储。 如果某个资源实例被停用、关闭或者删除,相应的原始指标数据停止上报1小时后,实例相关的指标就被删除。停用或关闭的实例被重新启用后,指标
视图。 用户可根据业务需求,拖动其中的监控视图,调整监控视图的顺序。 单击监控视图上方的“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”,可切换该监控看板下的所有视图的监控周期,其中“近1小时”以内的监控时长系统默认显示原始指标数据,其他时长周期默认显示聚合指标数据。
单击需要开启的云服务资源所在行右侧的一键告警开关,开启一键告警。 图1 开启一键告警 单击一键告警左侧的下拉按钮,可查看、修改或重置已开启的告警规则。 单击需要修改的告警规则所在行右侧的“修改”,可删除或添加告警策略,可根据需求设置发送通知。 单击资源类型所在行右侧的“重置”,可
排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可能导致管理控制台查不到操作系统监控数据。 修改裸金属服务器和用户客户端浏览器时间一致参考命令:timedatectl
通过资源分组实现云资源分组监控 对于有一定资源规模的组织或企业而言,资源数量大多会因为人工维护繁琐导致易出错,同时应用于不同生产环节的资源可能需要分组管理,例如用于测试和用于生产的资源相比,需要配置的监控与告警、通知渠道与接收用户也可能不一样。云监控支持根据实例名称、实例标签、企
指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 字符格式必须以字母开头,只能包含0-9/a-z/A-Z/_-,字符长度最短为1,最大为96。 dim 否 String 监控维度,例如弹性云服务器的维度为in
时间范围:可选择查询最近七天内任意时间段的操作事件。 在需要查看的记录左侧,单击展开该记录的详细信息,展开记录如图1所示。 图1 展开记录 在需要查看的记录右侧,单击“查看事件”,弹出一个窗口,如图2所示,显示了该操作事件结构的详细信息。 图2 查看事件的详细日志信息 父主题: 操作记录审计
告警通知系统模板更新记录 云监控服务930版本将短信告警通知系统模板中的告警信息进行了修改,具体变更信息如表1 短信-指标系统通知模板、表2 短信-系统事件系统通知模板和表3 短信-自定义事件系统通知模板所示: 表1 短信-指标系统通知模板 信息 变更操作 告警恢复状态 新增 跳转连接
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应
、使用中的数据库连接数等其他监控指标可根据您的实际情况来设置。 建议将弹性公网IP和带宽的出网带宽使用率告警阈值设置为80%,连续三次超过阈值后开始告警。其他监控指标可根据您的实际情况来设置。 单击“立即创建”,完成告警规则的创建。 当业务量飙升,RDS、弹性公网IP和带宽或EL