检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
0表示只告警一次,300表示每5分钟告警一次,600表示每10分钟告警一次,900表示每15分钟告警一次,1800表示每30分钟告警一次,3600表示每1小时告警一次,10800表示每3小时告警一次,21600表示每6小时告警一次,43200表示每12小时告警一次,86400表示每1天告警一次。
触发规则:选择自定义创建。 指标名称:在下拉框中选择“CPU使用率”。 告警策略:平均值、监控周期5分钟、>=、80%、连续三个周期、每1天告警一次。 告警级别:重要。 发送通知:是。 通知方式:主题订阅。 通知对象:选择创建告警通知主题创建的主题。 生效时间:00:00-23:59
通过广域网质量功能监控不同地域不同网络环境用户访问某个域名时的连通性。当域名连通性为低于预期时,您可以通过报警信息分析异常原因,还可以根据探测结果排查问题。本文以中国境内各省份的三大运营商(中国移动、中国电信、中国联通)探测某个域名为例,为您介绍如何通过广域网质量监控功能监控网络异常。
0表示只告警一次,300表示每5分钟告警一次,600表示每10分钟告警一次,900表示每15分钟告警一次,1800表示每30分钟告警一次,3600表示每1小时告警一次,10800表示每3小时告警一次,21600表示每6小时告警一次,43200表示每12小时告警一次,86400表示每1天告警一次。
触发规则 自定义创建。 告警策略 触发告警规则的告警策略。 例如:可用性连续三个周期≤90%,每一小时告警一次。 每一小时告警一次是指告警发生后如果状态未恢复正常,每间隔一个小时重复发送一次告警通知。 告警级别 根据告警的严重程度不同等级,可选择紧急、重要、次要、提示。 根据界面提示,配置告警通知参数。
例如:CPU使用率,监控周期为5分钟,连续三个周期平均值≥80%,每一小时告警一次。 基础监控和操作系统指标请参见云产品监控指标。 说明: 每一小时告警一次是指告警发生后如果状态未恢复正常,每间隔一个小时重复发送一次告警通知。 告警规则内最多可添加50条告警策略,若其中一条告警策略达到条件都会触发告警。
本节介绍使用Windows图形化界面方式添加域名解析地址的操作步骤和方法。 选择“服务列表 > 计算 > 弹性云服务器”。通过VNC方式登录Windows弹性云服务器。 打开“控制面板 > 网络与共享中心”,单击“更改适配器配置”。 右键单击使用的网络,打开设置,配置DNS。 图1 添加域名解析地址(Windows)
标”。 单击 “导出”。 一次可选择多个监控指标导出。导出文件格式为“csv”。 导出监控报告中第一行分别展示用户名、Region名称、服务名称、实例名称、实例ID、指标名称、指标数据、时间、时间戳。方便用户查看历史监控数据。 如需要将Unix时间戳转换成时区时间,请按照如下步骤:
通过API接口下发删除网卡指令。 确认是网卡否删除成功。 网卡资源删除。 变更规格 resizeServer 次要 云服务器规格变更。包括: 在管理控制台进行变更规格。 通过API接口下发变更规格指令。 确认规格是否变更成功。 实例先停机后开机。 GuestOS系统层重启告警 RestartGuestOS
Agent插件状态显示“故障”该如何处理? 操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
描述 URI-scheme 表示用于传输请求的协议,当前所有API均采用HTTPS协议。 Endpoint 指定承载REST服务端点的服务器域名或IP,不同服务不同区域的Endpoint不同,您可以从地区和终端节点获取。 例如IAM服务在“华北-北京四”区域的Endpoint为“iam
运行中:Agent运行正常,可正常上报监控数据。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
告警记录”,进入“告警记录”界面。 在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“查看监控详情”,右侧弹出监控详情页面,用户可查看资源的基本信息和最近一次告警状态改变数据。 图1 查看监控详情 在“告警记录”列表右上角可选择日历,查看近30天内的任意时间段内的告警记录。 在“告警记录”列表页
Agent状态切换或监控面板有断点该如何处理? 问题现象 当云监控服务的Agent进程出现以下现象时,可能是因为Agent负载过高,状态不稳定导致: 管理控制台主机监控页面的“插件状态”参数在“运行中”和“故障”两个状态切换。 监控指标面板中存在断点。 约束与限制 当前章节的修复
如何配置DNS和安全组? 本章节指导用户为Linux系统的主机添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,其他主机步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。
TCP 53 100.125.0.0/16 用于DNS解析域名,下载Agent时解析OBS地址、发送监控数据时解析云监控服务Endpoint地址。 1 允许 IPv4 UDP 53 100.125.0.0/16 用于DNS解析域名,下载Agent时解析OBS地址、发送监控数据时解析云监控服务Endpoint地址。
指标数据保留多长时间? 指标数据分为原始指标数据和聚合指标数据。 原始指标数据是指原始采样指标数据,原始指标数据一般保留2天。 聚合指标数据是指将原始指标数据经过聚合处理后的指标数据,聚合指标数据保留时间根据聚合周期不同而不同,通过API获取的聚合指标数据保留时间如下: 表1 聚合指标数据保留时间
当告警产生时,告警以特定的频率重复通知。 告警频率可设置以下几种方式: 只告警一次、每5分钟告警一次、每10分钟告警一次、每15分钟告警一次、每30分钟告警一次、每1小时告警一次、每3小时告警一次、每6小时告警一次、每12小时告警一次、每1天告警一次。 每5分钟告警一次 配置指标类告警策略示例 例如,指标名称为CPU利用率
2018-05-30 第二十二次正式发布。 本次变更如下: 新增批量查询监控数据接口。 新增上报事件接口。 2018-04-30 第二十一次正式发布。 本次变更如下: 新对接NAT网关服务。 主动监控新增监控指标。 2018-03-30 第二十次正式发布。 本次变更如下: 分布式缓存服务新增监控指标。
使用站点监控 应用场景 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 站点监控可以探测域名、IP的可用性、访问响应时间、丢包率,并对监控结果告警。 创建站点监控 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“站点监控”,进入“站点监控”页面。