检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
(Linux)。 已完成插件修复。 已获取待安装插件的弹性云服务器的root密码。 使用一键安装脚本配置插件 华为云部分区域支持使用一键安装脚本来配置插件,目前支持一键安装脚本的区域如表2所示。 使用root账号,登录ECS。 执行如下命令,在“/usr/local/”目录下新建“user
用户可根据业务需求,拖动其中的监控视图,调整监控视图的顺序,也可以使用展示功能调整每行展示的个数。 您还可以进入监控大屏查看监控视图,请参考大屏查询模式使用技巧。 用户可设置监控看板中刷新监控视图的时间,默认为“关闭刷新”状态。 在监控视图右上角,单击,进入监控项详情页面。您可以选择系统提供的固定时长或自定义时间段来查看云服务的监控周期内的走势图。
单击页面左侧的“事件监控”,在事件列表页面,单击相应事件右侧的创建告警规则。 此处以删除虚拟机事件为例,可根据业务需要,针对重启虚拟机、关闭虚拟机、删除网卡等创建告警规则。 当ECS、BMS出现异常时,云监控会在第一时间通过消息通知服务实时告知资源异常,提醒您处理,以免因此造成业务损失。
资源分组 一套完整的电商平台会使用到ECS、CDN、AS、安全服务、RDS、OBS、VPC等服务,您可以创建资源分组,将电商业务的ECS、EIP、EVS等资源划分成一个分组,通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。
时进行告警。 事件即云监控保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。 事件
t插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。 事件
图1所示。 图1 创建站点监控 配置完成后,单击“确定”,完成创建站点监控。 创建站点监控完成后,单击站点名称右侧的“ 创建告警规则”,为设置的站点配置告警规则。 在创建告警规则界面,按照界面提示配置参数,参数说明请参见配置参数。 建议针对可用性≤95%、响应时间≥400ms、丢
告警规则 随着业务的增长,当您发现当前的告警规则设置不合理,需要调整告警规则,以便更好的满足您的业务需求。 您可以参考本章节对这些不合理的告警规则设置进行调整。 告警规则简介 创建告警规则和通知 告警策略 修改告警规则 修改告警规则通知方式 停用告警规则 启用告警规则 删除告警规则
无 2.4.5 1分钟 net_tcp_sys_recv (Agent) TCP SYS_RECV状态的连接数量。 该指标用于统计测量对象服务器端收到的请求连接的TCP数量。 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。
MN新协议公测。 创建飞书机器人 本文以PC版飞书为例,为您介绍创建飞书机器人的操作方法。 在PC版飞书中打开发送告警通知的飞书群。 单击设置图标,添加机器人。 单击添加自定义机器人选项。 输入机器人名字,例如:云监控告警通知,完成添加。 单击复制,复制Webhook地址。 添加自定义关键词,确认无误后单击完成。
用户可手动卸载Agent插件,卸载后云监控服务将不再主动采集主机的监控数据。如需再次使用,请参考操作步骤或操作步骤重新安装。 查看Agent状态(老版本) 以root用户登录ECS或BMS,执行以下命令,查看Agent状态。 service telescoped status 当系统返回以下内容,则表示Agent为正常运行状态。
如果使用未经验证的外部系统,可能会出现依赖问题或引入其他不稳定因素,请谨慎使用。 操作系统 版本 支持Agent安装(ECS) 支持Agent一键安装(ECS) 支持Agent安装(BMS) Windows Windows 2012 √ × √ Windows 2016 √ ×
如生效时间为08:00-20:00,则该告警规则仅在08:00-20:00发送通知消息。 接收渠道 接收告警通知的渠道。 当接收对象选择主题订阅时,不涉及此参数设置。 通知内容模板 可选择默认或自定义。 若选择自定义,可选择指标模板、事件模板、站点监控模板、广域网质量监控模板,或单击“创建通知内容模板”创建新的通知内容模板。
告警通知屏蔽 批量设置告警通知屏蔽规则 批量修改告警通知屏蔽规则的屏蔽时间 修改告警通知屏蔽规则 批量删除告警通知屏蔽规则 查询告警通知屏蔽列表 查询告警通知屏蔽资源列表 父主题: 告警
实例运行状态异常 由于灾难或者物理机故障导致单机或者主实例出现故障时会上报本事件,属于关键告警事件,有可能导致数据库服务不可用。 检查是否有设置自动备份策略,并且提交工单处理。 单实例转主备实例失败 即创建备机或者备机创建完成后在主备机之间配置同步有故障,一般是由于备节点所在数据中
指标详情页会展示不同资源实例及下层子维度资源,可以进行切换查看不同的下层维度资源。 指标详情页可以支持批量查看不同资源的同一个监控指标。 支持对指标进行添加视图分组、以及自定义设置指标,可将关注的指标进行分门别类的管理。 图3 资源实例 云服务概览: 云服务概览是对该类云服务资源使用情况的总览,包括资源概览、告警统计、关键指标三个部分。
Agent不同插件状态说明及处理方式 Agent有以下五种状态: 未安装/未启动:指未在该ECS/BMS中安装Agent或手动停止了Agent。 运行中:Agent运行正常,可正常上报监控数据。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。
当通知方式选择通知组或主题订阅时,需要选择导入的模板。 您可以选择系统预置的默认告警模板,或者单击创建通知内容模板,自行创建。 生效时间 当通知方式选择通知组或主题订阅时,需要设置生效时间。 系统仅在生效时间内发送告警通知消息。 如生效时间为08:00-20:00,则该告警规则仅在08:00-20:00发送通知消息。
0-127.255.255.255 www.example.com 监控频率 站点监控探测引擎执行一次探测任务的时间间隔。 说明: 监控频率可设置为1分钟、5分钟、20分钟。 1分钟 分布式探测点 目前站点监控支持的探测点有:华北(廊坊)、华东(上海)、华南(广州)、西南(贵阳)、华南(深圳)、华南(广州)IPv6。
枚举类型:notification,autoscaling,groupwatch,ecsRecovery,contact,contactGroup,iecAction 枚举值: notification autoscaling groupwatch ecsRecovery contact contactGroup