检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
警通知功能,及时获取开发组下的两台弹性云服务器的资源运行状态(包含CPU利用率、CPU空闲时间占比、平均负载、I/O使用率、磁盘使用率、内存使用率、inode已使用占比),而测试组下的两台弹性云服务器不需要获取其运行状态。 表1 云服务器列表和分组规划 云服务器名称 分组 是否需要安装Agent
在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。
具体监控指标方面,可设置CPU使用率>80%、内存使用率>80%、磁盘使用率>80%,以下以CPU使用率为例。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。 单击弹性云服务器所在栏右侧的“更多”按钮,选择“创建告警规则”。
S的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控和事件监控随时监控ECS与BMS的运行状况。 网站与各个基础接口的可用性、响应时间、丢包率等会直接影响用户使用的流畅程度,需使用站点监控随时监控各站点的运行情况。 VPC、NAT
应用场景 一键告警为您提供针对服务下所有资源快速开启告警的能力,旨在帮助用户快速建立监控告警体系,在资源异常时可以及时获得通知。本章节介绍如何使用一键告警功能一键开启关键监控项告警的服务。 一键式告警和普通告警的主要差异点如表1所示。 表1 一键告警和告警对比一览表 告警类型 主要目标
cpu_usage_other (Agent)其他CPU使用率 该指标用于统计测量对象其他CPU使用率。 采集方式(Linux):其他CPU使用率=1- 空闲CPU使用率(%)- 内核空间CPU使用率- 用户空间CPU使用率。 采集方式(Windows):其他CPU使用率=1- 空闲CPU使用率(%)- 内核空间CPU使用率-
已安装GPU驱动,未安装lspci工具的云服务器影响GPU掉卡事件的上报。 如果您的弹性云服务器未安装GPU驱动,请参见GPU驱动概述安装GPU驱动。 安装GPU驱动需使用默认路径。 GPU驱动安装完后,需重启GPU加速型实例,否则可能导致采集GPU指标及上报GPU事件失败。 GPU驱动正常安装后,最多10分
您能创建的告警规则的数量与配额有关系,如果您想查看服务配额、扩大配额,具体请参见“配额调整”。 更详细的限制请参见具体API的说明。 父主题: 使用前必读
通知对象名称。 选择渠道 通知对象的渠道,每种渠道只能设置一个对象。 选择“电话”或“短信”终端,请输入有效手机号码。 输入规则为[+] [国家码][手机号码]。国内手机号码可省略[+]或[+] [国家码]。 例如: +8600000000000 +8600000000001 选择“邮箱”终端,请输入有效的邮箱地址。
Linux)。 已完成插件修复。 已获取待安装插件的弹性云服务器的root密码。 使用一键安装脚本配置插件 华为云部分区域支持使用一键安装脚本来配置插件,目前支持一键安装脚本的区域如表2所示。 使用root账号,登录ECS。 执行如下命令,在“/usr/local/”目录下新建“user
网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。 针对电商平台使用的RDS、ELB、VPC等服务,可以使用云服务监控,在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 电商业务主要涉及ECS、CD
创建主题 操作场景 主题作为发送消息和订阅通知的信道,为发布者和订阅者提供一个可以相互交流的通道。 在这一部分,您可创建一个属于自己的主题。 创建主题 登录管理控制台。 在管理控制台左上角选择区域和项目。 在服务列表选择“消息通知服务”。 进入消息通知服务页面。 在左侧导航栏,选择“主题管理”
支持的规格:所有规格的BMS。 若实例使用自建的私有镜像作为操作系统,请确保其包含了如下软件:dmidecode、lscpu、dmesg、lspci、modinfo、ifconfig、ethtool、hinicadm、smartctl、lsscsi、uname。 父主题: 其他插件安装说明
急告警。 重要告警:告警规则对应资源存在影响业务的问题,此问题相对较严重,有可能会阻碍资源的正常使用。 次要告警:告警规则对应资源存在相对不太严重点问题,此问题不会阻碍资源的正常使用。 提示告警:告警规则对应资源存在潜在的错误可能影响到业务。 父主题: 告警
基础监控与操作系统监控数据出现不一致的问题 现象 基础监控显示CPU使用率90%以上,接近100%,操作系统内监控的CPU使用率不到50%,两者相差较大。 原因 如果您在操作系统(Guest OS)中配置idle=poll,当操作系统内部空闲时,进入polling状态消耗计算资源
屏蔽告警规则 操作场景 对整条告警规则进行告警屏蔽。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警规则”。 在“告警规则”界面,单击告警规则所在行“操作”列的“更多”,选择“屏蔽告警”,在弹出的“屏蔽告警”界面,选择“屏蔽时间”后,单击“确定”即可完成对告警规则的屏蔽。
终端节点(Endpoint)即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 父主题: 使用前必读
促销、秒杀、爆款等电商业务场景,瞬间访问量达到平常的几十至数百倍,会导致服务器负载高,系统响应慢。 您可以对ECS的监控指标配置告警规则,比如CPU使用率,当CPU使用率达到配置的阈值时发送告警通知,及时处理异常。 前提条件 已安装Agent插件,具体安装步骤请参见安装配置Agent。 操作步骤 登录管理控制台。
主机监控分为基础监控、操作系统监控和进程监控。无论您使用的是弹性云服务器还是裸金属服务器,都可以使用主机监控来采集丰富的操作系统层面监控指标,也可以使用主机监控进行服务器资源使用情况监控和排查故障时的监控数据查询。 基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监控CPU使用率等指标,详见支持监控的服务列表。
创建资源分组 使用场景 针对使用多种云产品的用户,通过资源分组功能将同一业务相关的弹性云服务器、裸金属服务器、云硬盘、弹性IP、带宽、数据库等资源添加到同一资源分组中。从分组角度查管理资源,管理告警规则,可以极大的降低运维复杂度,提高运维效率。 限制与约束 一个用户最多可创建1000个资源分组。