检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基础监控:ECS/BMS自动上报的监控指标。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 Agent访问声明
安装Agent(Windows) 操作场景 本章节主要介绍如何在主机中安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 目前只支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。
操作场景 本章节主要介绍如何在单台主机中手动安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 目前只支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。
主机监控 ECS是电商平台的基础支撑,因此ECS上细微的性能变化,都可能会引起电商业务的大幅震荡,甚至出现宕机,引起巨大损失。 主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为
已配置委托,配置方法参考如何配置委托?。 确保操作步骤中的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。 登录方式为账号密码:已收集需要安装Agent的所有主机的IP地址和root用户密码,按照iplist.txt格式整理好,并上传到第一台机器的/usr/local目录下 iplist
资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保障用户的资源,Agent会主动触发
在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致; 已触发:监控的资源触发了告警策略中配置的事件; 已失效:告警规则中监控的资源或告警策略有调整,原有的告警记录状态失效。 父主题:
Agent支持的系统有哪些?。 支持的GPU加速型规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1。 暂不支持CCE纳管后的GPU加速型实例。 前提条件 已安装GPU驱动,未安装lspci工具的云服务器影响GPU掉卡事件的上报。 如果您的弹性云服务器未安
您可以在主机监控页面筛选出不同状态监控插件的云服务器。 商用 - 2 告警通知内容优化 为了使您更容易地识别资源指标告警的影响和范围,云监控服务在指标的告警通知中,增加了告警资源名称,指标数据当前值。在云服务器的告警通知中,增加了云服务器的私网IP。 商用 - 2020年10月 序号
对于需要导出监控数据的账号,要求具有IAM,CES,Config,EPS服务的读权限,另外获取哪些服务的监控数据就需要有哪些服务的读权限。 安装配置cloudeye-exporter 在Ubuntu ECS实例上安装cloudeye-exporter。 在github的cloudeye
近24小时”、“近7天”以内的监控时长系统默认显示聚合指标数据。 整体探测分析如下图所示,可查看可用率、平均响应时间、城市最慢TOP5、运营商最慢TOP5、错误类型TOP5。 管理广域网质量监控 在“监控任务”页面,单击待修改的广域网质量监控所在行的“修改任务”。 进入“编辑任务”界面。
dc-nqa-collector插件。各个区域的安装包下载地址请参见表1。 监控资源的信息:一条监控资源占据一行,由资源ID和远端IP组成,二者以英文状态的“,”隔开。若需添加多条资源,则以同样的格式依次新增行。 资源ID:32位的字母或数字,格式如“b95b9fdc-65de-
当告警触发后,我们需要定义通知的渠道和对象,快速的将告警信息通过配置的渠道通知到运维人员。 当前CES支持以下三种方式来完成通知的配置。 通知策略(推荐):产品最新上线能力,通过通知策略可以完成告警的分级通知、简易排班。 通知组:通过在云监控服务上配置的通知群组,可以快速通知到指定运维人员。
合成一个点,所以导致查询出来的指标数据量少于上报的数据量。 原因2:若上报指标周期与批量查询监控数据的监控周期相同,根据上面计算规则,最多返回的指标数据量为3000。 解决方法 将请求参数监控周期按照接口文档给出的枚举值选择小点的监控周期。 使用查询监控数据接口查询指标数据(仅支
视图。 用户可根据业务需求,拖动其中的监控视图,调整监控视图的顺序。 单击监控视图上方的“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”,可切换该监控看板下的所有视图的监控周期,其中“近1小时”以内的监控时长系统默认显示原始指标数据,其他时长周期默认显示聚合指标数据。
登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。 此时页面上显示了当前云平台上的弹性云服务器列表。 单击ECS主机所在栏右侧的“更多 > 创建告警规则”。 弹出创建告警规则的窗口。 输入告警规则名称和描述。 按照如下所示配置参数。 触发规则:选择自定义创建。
为了更好监控弹性负载均衡服务,需要先开启负载均衡ELB的健康检查,详情参见健康检查异常如何排查?,建议设置负载均衡ELB网络流出速率的80%作为告警阈值。 建议将RDS的CPU使用率告警阈值设置为80%,连续三次超过阈值后开始告警。磁盘使用率、IOPS、使用中的数据库连接数等其他监控指标可根据您的实际情况来设置。
当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。 Windo
资源数(告警中/已触发/资源总数) 组内所有正在告警的资源数/已触发告警的资源数/组内所有资源的数量。 资源类型数 组内资源类型的数量,例如组内有2台弹性云服务器 、1个云硬盘两种资源类型,则资源类型数为2。 归属企业项目 拥有资源分组权限的企业项目名称。 创建方式 创建资源分组的方式,有手动添加和智能添加两种。
本章节指导用户为Linux系统的ECS或BMS添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。