检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
网络分析与监控 通过HTTP(S)探测监控网络异常
可视化 使用自定义看板创建个性化的视图
在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。
警通知功能,及时获取开发组下的两台弹性云服务器的资源运行状态(包含CPU利用率、CPU空闲时间占比、平均负载、I/O使用率、磁盘使用率、内存使用率、inode已使用占比),而测试组下的两台弹性云服务器不需要获取其运行状态。 表1 云服务器列表和分组规划 云服务器名称 分组 是否需要安装Agent
具体监控指标方面,可设置CPU使用率>80%、内存使用率>80%、磁盘使用率>80%,以下以CPU使用率为例。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。 单击弹性云服务器所在栏右侧的“更多”按钮,选择“创建告警规则”。
cpu_usage_other (Agent)其他CPU使用率 该指标用于统计测量对象其他CPU使用率。 采集方式(Linux):其他CPU使用率=1- 空闲CPU使用率(%)- 内核空间CPU使用率- 用户空间CPU使用率。 采集方式(Windows):其他CPU使用率=1- 空闲CPU使用率(%)- 内核空间CPU使用率-
使用自定义看板创建个性化的视图 应用场景 自定义看板作为云服务看板的补充,允许您可以通过自定义的方式创建可视化看板,您可以自主选择指标、图表类型来展现您关注的资源图表。本章以查看多台ECS实例下带外网络流出速率的监控数据变化趋势为例,为您介绍我的看板的具体操作流程。更多操作指导请参考监控看板。
S的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控和事件监控随时监控ECS与BMS的运行状况。 网站与各个基础接口的可用性、响应时间、丢包率等会直接影响用户使用的流畅程度,需使用站点监控随时监控各站点的运行情况。 VPC、NAT
您能创建的告警规则的数量与配额有关系,如果您想查看服务配额、扩大配额,具体请参见“配额调整”。 更详细的限制请参见具体API的说明。 父主题: 使用前必读
急告警。 重要告警:告警规则对应资源存在影响业务的问题,此问题相对较严重,有可能会阻碍资源的正常使用。 次要告警:告警规则对应资源存在相对不太严重点问题,此问题不会阻碍资源的正常使用。 提示告警:告警规则对应资源存在潜在的错误可能影响到业务。 父主题: 告警
基础监控与操作系统监控数据出现不一致的问题 现象 基础监控显示CPU使用率90%以上,接近100%,操作系统内监控的CPU使用率不到50%,两者相差较大。 原因 如果您在操作系统(Guest OS)中配置idle=poll,当操作系统内部空闲时,进入polling状态消耗计算资源
通知对象名称。 选择渠道 通知对象的渠道,每种渠道只能设置一个对象。 选择“语音通知”或“短信”,请输入有效手机号码。 输入规则为[+] [国家码][手机号码]。国内手机号码可省略[+]或[+] [国家码]。 例如: +8600000000000 +8600000000001 选择“邮件”,请输入有效的邮箱地址。
网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。 针对电商平台使用的RDS、ELB、VPC等服务,可以使用云服务监控,在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 电商业务主要涉及ECS、CD
一键告警 一键告警为您提供针对服务下所有资源快速开启告警的能力,旨在帮助用户快速建立监控告警体系,在资源异常时可以及时获得通知。本章节介绍如何使用一键告警功能一键开启关键监控项告警的服务。 一键式告警和普通告警的主要差异点如表1所示。 表1 一键告警和告警对比一览表 告警类型 主要目标
终端节点(Endpoint)即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 父主题: 使用前必读
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保障用户的资源,Agent
包含网口的MAC地址、链路状态、接收/发送端的丢包&错包计数。 使用ifconfig <网口名>命令采集。 网口设备信息 包含网口的端口类型、Link状态、速率。 使用ethtool <网口名>命令采集。 网口驱动信息 包含固件版本、驱动版本、总线号。 使用ethtool -i <网口名>命令采集。 光模块信息
促销、秒杀、爆款等电商业务场景,瞬间访问量达到平常的几十至数百倍,会导致服务器负载高,系统响应慢。 您可以对ECS的监控指标配置告警规则,比如CPU使用率,当CPU使用率达到配置的阈值时发送告警通知,及时处理异常。 前提条件 已安装Agent插件,具体安装步骤请参见安装配置Agent。 操作步骤 登录管理控制台。
主机监控分为基础监控、操作系统监控和进程监控。无论您使用的是弹性云服务器还是裸金属服务器,都可以使用主机监控来采集丰富的操作系统层面监控指标,也可以使用主机监控进行服务器资源使用情况监控和排查故障时的监控数据查询。 基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监控CPU使用率等指标,详见支持监控的服务列表。
创建自定义告警/事件模板 您可以选择云服务监控提供的默认模板,也可以根据需要自定义添加告警指标完成自定义告警模板的添加。本章节介绍如何创建自定义告警/事件模板。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警模板”,进入告警模板界面。 在“告警模板”界面,单击“创建自定义模板”。