检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控 在视频直播中,弹性云服务器作为核心基础,细微的性能变化,可能会引起云服务上的业务受到大幅震荡。为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 本章节介绍如何对弹性云服务器的CPU使用率、内存使用率、磁盘使用率设置告警规则。并在弹性伸缩中配置弹性伸
电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口,双1
命名空间 维度 监控指标参考文档 计算 弹性云服务器 SYS.ECS Key:instance_id Value:云服务器ID 弹性云服务器的基础监控指标 弹性云服务器中操作系统监控 AGT.ECS Key:instance_id Value:云服务器ID Key:disk Value:磁盘
time 是 Long 事件发生时间。UNIX时间戳,单位毫秒。 说明: 因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 例如,当前时间为2020.01.30
式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资源都会自动获得此授权。本节针对本授权做以下说明:
取值范围:只能由中文、英文字母、数字、下划线、中划线组成。长度范围:1-128个字符。 取值样例:dataShareJob-ECSMetric 资源类型 云监控服务监控的资源类型。 取值样例:弹性云服务器。 维度 监控对象的范围。 各服务监控对象的维度值请参考监控指标说明页面的“监控指标”和“维度”表格中描述。
resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dimensions Arrays of objects 是 一个或者多个资源维度。
弹性公网IP事件 虚拟私有云为弹性云服务器构建隔离的、用户自主配置和管理的虚拟网络环境,提升用户云中资源的安全性,简化用户的网络部署。 当您的弹性云服务器要访问Internet时,您可使用虚拟私有云创建的弹性公网IP绑定到弹性云服务器上,弹性云服务器即可连接公网。不同弹性公网IP还可以共享带宽,减少您的带宽成本。
在“网关和DNS”区域单击“DNS服务器地址”后的。 DNS服务器地址与3中的nameserver保持一致。 图3 修改DNS服务器地址 单击“确定”,保存设置。 在控制台修改DNS需重启ECS或BMS后生效。 修改ECS的安全组规则(管理控制台) 本节介绍登录管理控制台后修改ECS安全组规则的操作
在“网关和DNS”区域单击“DNS服务器地址”后的。 DNS服务器地址与3中的nameserver保持一致。 图3 修改DNS服务器地址 单击“确定”,保存设置。 在控制台修改DNS需重启ECS或BMS后生效。 修改ECS的安全组规则(管理控制台) 本节介绍登录管理控制台后修改ECS安全组规则的操作
一键告警和告警对比一览表 告警类型 主要目标 范围 告警对象 告警触发方式 一键告警 当重要事件发生时,立即触发告警通知。 优势:配置简单,一键式打开开关。 弹性云服务器、弹性公网IP和关系型数据库的重要事件。 事件监控 指标监控 立即触发 普通告警 根据设置的告警策略触发告警。例如:CPU利用率在5分
云账号联系人为注册时的手机和邮箱。 主题是消息发布或客户端订阅通知的特定事件类型,若此处没有需要的主题则需先创建主题并添加订阅,创建主题并添加订阅请参见创建主题、添加订阅。 生效时间 该告警仅在生效时间段发送通知消息,非生效时段则在隔日生效时段发送通知消息。 如生效时间为08:00-20:00,则该告
支持的云产品以及云产品对应的监控指标说明,请参见云产品监控指标。 弹性云服务器-云服务器 资源层级 当告警类型选择指标时,需选择告警规则的资源层级,可选择云产品或子维度,推荐选择云产品。 以弹性云服务器ECS为例:用户购买了云产品(ECS虚拟机),根据指标划分了多个子维度(包含磁盘、挂载点、进程等)。
短为3,最大为32。 time Long 是 事件发生时间。UNIX时间戳,单位毫秒。 说明:因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 detail
云账号联系人:注册时的手机和邮箱。 主题:消息发布或客户端订阅通知的特定事件类型,若此处没有需要的主题,需先创建主题并订阅该主题,详细操作请参见创建主题、添加订阅。 生效时间 系统仅在生效时间内发送告警通知消息。 如生效时间为08:00-20:00,则该告警规则仅在08:00-20:00发送通知消息。
为什么云服务器看不到内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标? 当前创建的Linux云服务器,均不支持内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标。但Windows云服务器是支持这四个指标的。 不同操作系统支持的基础监控指标
目前大部分区域已上线一键式授予该区域插件权限功能,即自动修复插件配置。您可以单击“主机监控 - 弹性云服务器”页面上方的“一键配置”开启该区域插件权限。配置完成后此区域所有服务器均默认修复插件配置,后续不再显示“一键配置”按钮。若提示租户权限不足,请参考主机监控界面单击一键配置
返回“0”,表示未安装Agent。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 网络问题 问题解决(Linux) 以root用户登录弹性云服务器或裸金属服务器。 执行如下命令,检查telescope进程是否存在:
原因2:指标对应的维度错误。详见下方【案例二】 原因3:ECS实例未安装agent插件。详见下方【案例三】 原因4:ECS实例安装的agent插件没有上报磁盘使用率指标数据。详见下方【案例四】 案例一 命名空间错误 命名空间错误。若查询的是弹性云服务器中操作系统监控指标,命名空间需为AGT.ECS。 请求参数: {
本章节为您解答上述问题。 假设我们有4台云服务器,两台用于开发项目组(ECS-01和ECS-02),两台用于测试项目组(ECS-03和ECS-04)。现在需要通过告警通知功能,及时获取开发组下的两台弹性云服务器的资源运行状态(包含CPU利用率、CPU空闲时间占比、平均负载、I/O使用率、磁