检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Eye)为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解华为云上的资源使用情况、业务的运行状况,并及时收到异常报警做出反应,保证业务顺畅运行。 图说云监控 产品介绍 立即使用 成长地图 由浅入深,带您玩转云监控 01 了解 了解华为云云监控服务的应用场景、相关概念和支持监控的服务列表,有助于
云监控服务哪些资源支持企业项目? 目前,支持按企业项目分权分域的有:我的看板、资源分组、告警规则、可用性监控、云服务监控、站点监控和广域网质量监控。 父主题: 云服务监控
附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 详细的公共请求消息头字段请参见表3。 表3 公共请求消息头 名称 描述 是否必选 示例 Host 请求的服务器信息,从服务API的URL中获取。值为h
配置参数 参数 参数说明 名称 屏蔽规则的名称。 选择对象 选择要屏蔽的对象。 说明: 单次最多可添加100个该服务的资源。 选择策略屏蔽时,需要先选择规则和选择策略后,再选择对象。 选择指标 仅当屏蔽方式为资源屏蔽时,可选择需要屏蔽告警的指标。 说明: 如果不指定指标,则对所有指标生效。
单击“告警 > 告警屏蔽”,进入告警屏蔽界面。 在“告警屏蔽”界面,单击待修改屏蔽规则所在行“操作”列的“删除”。或者勾选一个或多个要删除的告警屏蔽,单击列表左上方的“删除”。 在弹出的“删除屏蔽规则”界面,单击“确定”,即可删除该屏蔽规则。 父主题: 告警屏蔽
各云服务的资源告警和站点响应情况。 资源监控 资源监控是以资源分组维度横向展示和各个服务资源维度纵向分布,将各个资源的实时告警情况进行展示,用户可按照不同维度对资源告警进行关注,方便高效管理您的资源。 下面将介绍资源监控如何查看和使用。 在总览页面的左侧展示了全部资源的健康评分、
表1 云服务监控详情简介 看板内容 说明 资源概况 统计的是当前云服务您所选维度下的资源数据。包含“资源总数”、“正在告警资源数”、“已配置告警资源数”和“7日告警资源数”的统计。 告警统计 该数据统计的是近7天状态为“告警中”的告警级别明细和资源分组告警。告警级别明细中包含对“紧急
企业项目的子用户在配置告警规则时,无法选择全部资源 配置告警规则可选择全部资源的功能只有主账号或配置了Tenant Administrator权限的子用户才有权使用。 如何为子账号设置Tenant Administrator权限,请参考创建用户组并授权。 父主题: 告警
入网带宽和出网带宽出现负值 老版本Agent在统计出入网带宽时,如若装有docker,当容器重启时无法统计虚拟网卡值,由于计算的是差值而导致出现负值的情况。 请参照管理Agent更新Agent。 父主题: 主机监控
当告警触发后,我们需要定义通知的渠道和对象,快速的将告警信息通过配置的渠道通知到运维人员。 当前CES支持以下三种方式来完成通知的配置。 通知策略(推荐):产品最新上线能力,通过通知策略可以完成告警的分级通知、简易排班。 通知组:通过在云监控服务上配置的通知群组,可以快速通知到指定运维人员。
查看告警模板 告警模板是一组以服务为单位的告警规则组合,方便用户对同一个云服务下多个资源批量创建告警规则。云监控服务根据各云服务的服务属性提供了推荐使用的告警模板,同时也支持您根据自身需求选择监控指标来创建告警模板。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。
根据需要可选择通知策略、通知组或主题订阅的方式。 通知策略支持告警分级别灵活通知,更全量通知渠道等更多功能。 通知组的通知内容模板在云监控服务配置。 主题订阅的通知内容模板需要在消息通知服务配置。 通知策略 当通知方式选择通知策略时,需要选择告警通知的策略。通知策略是包含通知组选择、生
数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可能导致管理控制台查不到操作系统监控数据。 修改裸金属服务器和用户客户端浏
视图。 用户可根据业务需求,拖动其中的监控视图,调整监控视图的顺序。 单击监控视图上方的“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”,可切换该监控看板下的所有视图的监控周期,其中“近1小时”以内的监控时长系统默认显示原始指标数据,其他时长周期默认显示聚合指标数据。
一键告警”,进入一键告警界面。 单击需要开启的云服务资源所在行右侧的一键告警开关,开启一键告警。 图1 开启一键告警 单击一键告警左侧的下拉按钮,可查看、修改或重置已开启的告警规则。 单击需要修改的告警规则所在行右侧的“修改”,可删除或添加告警策略,可根据需求设置发送通知,告警通知参数配置请参见表3。
资源数(告警中/已触发/资源总数) 组内所有正在告警的资源数/已触发告警的资源数/组内所有资源的数量。 资源类型数 组内资源类型的数量,例如组内有2台弹性云服务器 、1个云硬盘两种资源类型,则资源类型数为2。 归属企业项目 拥有资源分组权限的企业项目名称。 创建方式 创建资源分组的方式,有手动添加和智能添加两种。
如何将告警通知发送给子账号? 如您想要将告警通知发给子账号,可以通过创建主题并添加订阅(在订阅信息中配置您的手机号码或邮箱),然后在创建告警规则时选择告警通知对象为您创建的主题 。 父主题: 告警
云监控 内置指标 各个服务有自己内置支持的指标和维度,比如弹性云服务器(SYS.ECS)支持的指标有cpu_util等。 Metric Metric由3部分组成:Namespace,Dimensions(optional),MetricName,单纯的MetricName不是一个指标,不能标识任何东西。
数据转储是指在使用云服务监控时将一些重要的监控指标数据信息通过使用转储能力将数据存储到分布式消息服务kafka中,以便数据能及时保存,进而对业务监控数据做更详细的分析或者其他数据消费使用。 数据转储可以实时将云服务监控数据转储到当前账号与其他账号的分布式消息服务Kafka中。 父主题:
告警级别分为紧急,重要,次要,提示四种级别,其中告警规则的告警级别由用户设置,用户可根据自己业务及告警规则设置合理告警级别,四种级别简单说明如下: 紧急告警:告警规则对应资源发生紧急故障,影响业务视为紧急告警。 重要告警:告警规则对应资源存在影响业务的问题,此问题相对较严重,有可能会阻碍资源的正常使用。 次要告警: