检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控配置监控及告警的全流程介绍 主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要,本文主要介绍主机如何进行监控及配置告警。 应用场景 当用户购买了主机资源后,对于资源的运行状态需要进行必要的监控,以及对重点业务指标进行配置监控告警,能及时准确掌握主机资源的云上运行状态。
对于需要导出监控数据的账号,要求具有IAM,CES,Config,EPS服务的读权限,另外获取哪些服务的监控数据就需要有哪些服务的读权限。 安装配置cloudeye-exporter 在Ubuntu ECS实例上安装cloudeye-exporter。 在github的cloudeye
每小时探测的总次数 * 100%。 packet_loss_rate 丢包率 丢包率是数据包丢失部分与所传数据包总数的比值。 http_code HTTP响应码 HTTP响应码代表服务端反馈的响应状态,即标准的HTTP状态码。是用3位数字表示网页服务器超文本传输协议响应的状态。如:
际作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先原则。 如果您给用户授予CES FullAccess的系统策略,但不希望用户拥有CES FullAccess中定义的删除告警规则权限,您可以创建一条拒绝删除告警规则的自定义策略,然后同时将CES
本文介绍了CES服务提供的SDK语言版本,列举了最新版本SDK的获取地址。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 SDK列表 在开始使用之前,请确保您安装的是最新版本的SDK。使用过时的版本可能会导致兼容性问
服务管理控制台或API接口查看云服务运行状态并设置告警规则。 实时可靠 原始采样数据实时上报,提供对云服务的实时监控,实时触发产生告警并通知用户。 监控可视化 云监控服务通过监控面板为用户提供丰富的图表展现形式,支持数据自动刷新以及指标对比查看,满足用户多场景下的监控数据可视化需求。
而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内存使用率等。监控指标是与时间有关的变量值,会随着时间的变化产生一
无法触发告警? 问题现象 已经配置了CBR等服务的5分钟聚合指标告警规则,连续3次触发则告警。实际却无法触发告警。 问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值, 因此无法触发告警。
大屏。监控面板大屏将您自定义的监控视图内容整合到同一个可视化页面,视觉效果更好。 商用 查看监控视图 2019年06月 序号 功能名称 功能描述 阶段 相关文档 1 API接口支持细粒度授权 API接口支持细粒度授权,您可以针对具体某个API操作授权用户,权限控制更加精细。 商用
在“告警规则”界面,单击待修改告警规则所在行“操作”列的“修改”按钮; 在“告警规则”界面,选择待修改告警规则名称,进入告警规则详情页面,单击右上角“修改”。 在弹出的“修改告警规则”页面中修改告警规则配置参数。 修改告警规则时,告警类型、云产品、资源层级和监控范围的参数为默认值,不可修改,若监控范围
云监控服务”。 单击页面左侧导航栏的“云服务监控”,进入“云服务监控”页面,单击待配置的云服务名称,单击右上角“返回旧版”。 选择待查看的云服务资源所在行的“配置数据存储”,进入“配置数据存储”页面。 或单击页面左侧的“主机监控”,选择待查看的ECS资源所在行的“操作 > 配置数据存储”,进入“配置数据存储”页面。
聚合是指云监控服务在一定周期内对原始采样指标数据进行最大、最小、平均、求和或方差值的计算,并把结果汇总的过程。这个计算周期又叫聚合周期。 聚合是一个平滑的计算过程,聚合周期越长、平滑处理越多,用户对趋势的预测越准确;聚合周期越短,聚合后的数据对告警越准确。 云监控服务的聚合周期目前最小是5分钟,同时还有20分钟、1小时、4小时、1天,共5种聚合周期。
查看云服务监控指标 云监控服务基于云服务自身的服务属性,已经内置了详细全面的监控指标。当您在云平台上开通云服务后,系统会根据服务类型自动关联该服务的监控指标,帮助您实时掌握云服务的各项性能指标,精确掌握云服务的运行情况。 本章节指导用户如何查看云服务资源的监控数据,若发现有异常时可以及时处理。
主机监控Agent对主机的性能会有影响吗? 主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下:
配置弹性伸缩策略 告警规则与伸缩策略创建完成后,当业务量飙升,监控指标触发设定的阈值时,系统自动增加一个实例并在第一时间通过消息通知服务的Notifiaction中的电话和短信实时告知资源异常,提醒您处理,以免因此造成业务损失。 “告警通知”功能触发产生的告警消息由消息通知服务SM
Agent能够自动获取临时AK/SK,这样您就可以安全方便的使用云监控服务管理控制台或API查询Agent监控数据指标了。 安全:Agent使用的AK/SK仅具有CES AgentAccess权限的临时AK/SK,不会使用客户全局AK/SK,即当前的临时AK/SK只具备操作云监控服务的权限。 方便:您仅需在一个区域配置一次即可,无需对每个CES
带宽的监控数据没有超限记录但是收到了告警通知 出现此种情况,可能是您的事件监控的告警机制配置的“立即触发”,而带宽的监控数据聚合方式默认为5分钟内的平均值。因此您收到了事件告警的短信通知,但监控数据是正常的。 父主题: 告警
选择“云服务监控”。 分别单击弹性公网IP和带宽与NAT网关所在行的“创建告警规则”。 这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。 出网带宽使用率建议配置为80%。 “告警通知”功能触发产生的告警消息由消息通知服务SMN发送
Agent能够自动获取临时AK/SK,这样您就可以安全方便的使用云监控服务管理控制台或API查询Agent监控数据指标了。 安全:Agent使用的AK/SK仅具有CES Administrator权限的临时AK/SK,不会使用客户全局AK/SK,即当前的临时AK/SK只具备操作云监控服务的权限。 方便:您仅需在一个区域配置一次即可,无需对每个CES
创建主机监控的告警通知 当您需要监控各云产品资源的使用情况时,可以创建告警规则并配置告警通知。如果资源的监控指标触发设定的阈值,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。本章节指导用户对ECS或BMS的监控指标创建告警规则。 操作步骤 登录管理控制台。