检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
s实例名称,进入该实例的“账号接入”界面。 在“账号接入”界面可以管理成员账号、接入云服务、选择数据存储,并添加云服务支持的相关指标。 管理成员账号:AOM为企业用户提供多账号关系的管理能力,支持用户将多个华为云账号整合到创建的组织中,并可以集中管理组织下的所有账号。组织下有三种
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring
us实例的实例名称。 在实例详情页面左侧导航栏选择“设置”页签,获取当前实例的服务地址。 下面的操作以获取CCE类型Prometheus实例的服务地址为例进行说明。 单击“内网”或“公网”页签,可以获取对应“内网”或“公网”下的Remote Read和Remote Write P
输入关键词:单击文本框,文本框下面显示了该桶下的所有统计规则及其关键词,可直接单击进行选择,选择后统计规则的关键词会自动输入到文本框中;也可直接在文本框中手动输入关键词。 对于常用的、复杂的关键词,可单击,创建统计规则。在后续查询时,不用再在文本框中手动输入,直接单击文本框,选择对应的统计规则及其关键词,
集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。 约束与限制
静默条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 若串行条件设置为“告警级别等于紧急”,则符合告警级别为紧急的告警通知会被屏蔽。 静默时间 告警通知被屏蔽的时间,包含以下两种:
如图5所示,单击规则名称前的,可查看该告警规则的详细信息。 在展开的列表中,只要监控对象满足设置的告警条件时,在告警列表界面就会生成一条指标类告警,您可在左侧导航栏中选择“告警管理 > 告警列表”,在告警列表中查看该告警。只要当前示例使用的DCS实例的CPU利用率指标满足已设的通知策略,系统就会以邮件、短信或企业微信等方式发送告警通知给指定人员。
使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
在“规则名称”列单击统计规则名称,查看统计规则的详细信息。 修改统计规则 单击“操作”列的“编辑”。 删除统计规则 删除一个统计规则:单击“操作”列的“删除”。 删除一个或多个统计规则:选中一个或多个统计规则前的复选框,单击页面上方的“删除”。 说明: 删除统计规则后,您的日志桶、日志文件均不会被删除。
当采集器被重启后,重启时间点附近可能会产生一定的数据重复。 日志 统计规则 一个日志桶下最多可创建5条统计规则。 历史日志 日志数据存储时长与您选择的版本有关,且收费不同,详见价格详情。 告警 告警 您最多可查询最近31天的告警。 事件 您最多可查询最近31天的事件。 - 应用发现规则 应用发现规则最多可创建100个。
组件列表展示组件不同的指标监控项。AOM支持查看组件的指标监控项。 通过全局拓扑图查看应用间调用关系 通过拓扑图可以自动梳理服务之间的调用关系,同时也可以从全局视角查看服务之间调用是否正常,帮助用户快速定位问题。 通过调用链查看微服务间调用关系 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截对应请求
云服务实例过滤显示。 单击右上角的,可实时获取到该云服务全部实例的最新信息。 单击任一实例名称,在对应实例页签中监控云服务实例各指标的数据曲线。 在页面右上角设置指标信息的统计周期,查看不同时间段的历史数据。 设置时间范围,查看已设时间范围内上报的指标。可通过如下两种方式设置时间范围:
当采集器被重启后,重启时间点附近可能会产生一定的数据重复。 日志 统计规则 一个日志桶下最多可创建5条统计规则。 历史日志 日志数据存储时长与您选择的版本有关,且收费不同,详见价格详情。 告警 告警 您最多可查询最近31天的告警。 事件 您最多可查询最近31天的事件。 - 应用发现规则 应用发现规则最多可创建100个。
XX+正则+表达式:表示根据正则表达式匹配告警的XX参数的值。例如设置为:资源类型+正则+host*,表示筛选出metedata字段中资源类型的值包含host字样的告警。 设置规则说明: 分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每个并行条件下可设置一个或多个告警行动规则。
”界面。 在左侧导航栏中选择“参数库”,单击右上角的“创建参数”。 填写参数信息,具体的参数说明请参见表1。 图1 填写参数信息 表1 填写参数信息 参数名称 说明 参数类型 参数的类型,目前仅支持字符串类型。 参数名称 参数的名称。 最多可输入64个字符,只能由大小写字母组成。
欠费说明 用户在使用云服务时,账户的可用额度小于待结算的账单,即被判定为账户欠费。欠费后,可能会影响云服务资源的正常运行,请及时充值。 欠费原因 按需计费模式下,您的账户的余额不足会导致欠费。 欠费影响 当您的账号因AOM按需资源自动扣费导致欠费后,账号将变成欠费状态。欠费后,按
指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM支持为主机、组件等多种资源的指标设置阈值告警,具体支持的指标类型可在创建阈值告警规则的页面查看。 更多指标介绍可参见指标总览。 创建方式 阈值告警规则的创建方式分为两种:自定义阈值规则和使用模板创建阈值
从下拉列表选择告警降噪的分组规则。如果现有的分组规则无法满足需要,可单击“新建分组规则”添加,具体操作请参见分组规则。 图3 设置告警降噪方式 单击“立即创建”,完成创建。创建了一条阈值规则,单击其前的,可对其下的多个资源的同一指标批量监控。 在展开的列表中,只要某个主机的指标数据满足设
实例列表”,在实例列表中单击已创建的Prometheus实例的实例名称。 在实例详情页面左侧导航栏选择“设置”页签,获取当前实例的服务地址。 下面的操作以获取CCE类型Prometheus实例的服务地址为例说明。 单击“内网”或“公网”页签,可以获取对应“内网”或“公网”下的Remote Read和Remote
自定义标识主机组下的主机不支持该操作。 批量移除主机 在主机组列表,单击待修改的主机组所在行前的。 在主机页签,勾选待移除的主机,单击“批量移除”。 单击“确定”。 说明: 自定义标识主机组下的主机不支持该操作。 查看相关日志接入规则 在主机组列表,单击待修改的主机组所在行前的。 选择“