检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择对应日志组、日志流下的可视化图表,单击“确定”。若该日志流下没有图表或没有所需的图表,单击界面上的“前往添加图表”,进入可视化界面,设置完成后单击“保存并返回”返回到告警规则界面,自动打开创建规则弹框,填充新创建的图表及图表的查询语句。 可以指定图表的查询时间(1 ~ 60分钟/1
产品规格差异 应用运维管理服务(简称AOM)按计费方式不同分为基础版、按需版两种,其中按需版又分为专业版和企业版。 各版本的具体规格差异请参见表1。 表1 版本规格差异说明 规格项 基础版 专业版 企业版 日志读写流量 500MB 400GB 1TB 日志索引流量 500MB 400GB
开关默认为关闭,开关置灰。 Live Object Memory:已分配但未被回收的堆内存,使用场景主要包括内存泄漏等。该特性需要JDK版本为JDK17。 Allocated Memory:已分配的堆内存(包括已被回收和未被回收的部分),使用场景包括频繁GC等。 时延 开启后将采集应用运行过程中时延火焰图信息。
开通自动化运维 开通自动化运维时,因为不同区域是互相隔离的,对于不同的区域(例如:华北-北京一、华南-广州等),您需分别进行开通操作。 用户首次登录开通自动化运维,需要添加Security Administrator角色,后续使用自动化运维服务则不需要此角色权限。 自动化运维功能
Prometheus实例读写地址支持公网的局点 华为云用户应使用公网Remote Read地址和Remote Write地址访问AOM的Prometheus监控服务,内网地址仅供华为云内部云服务调用。 公网Remote Write地址仅部分局点支持,具体请参见表1。 表1 支持公网数据上报的说明 局点名称
使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。
关心,由于SAP系统都是企业内的核心业务系统,仅仅IAAS监控难再满足业务的需求,IT运维也日渐趋向于以应用为中心,需要结合SAP应用监控(数据库和中间件),来确保服务器与应用的正常健康运行,进而保证关键业务系统的高可用性和性能。 该方案构建云上的SAP应用监控系统,提供了如下几种应用监控特性:
采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。 阈值规则 (非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域)
概述 AOM提供告警行动规则定制功能,当资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 通过创建告警行动规则关联SMN主题与消息模板。 通过创建消息模板,自定义通知消息配置。 告警行动规则创建成功后,可在“告警> 告警降噪> 分组规则”中“创建分组规则”关联行动规则。
采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。 阈值规则 (非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域)
单击“基础监控”,切换至基础监控页签。页面默认展示“全部实例”的“JVM监控”信息。 您还可以根据需要执行以下操作: 在“实例名称”和“监控项”下拉框中选择实例与监控项,可以查看该实例在对应采集器下的不同指标集下的应用监控数据,具体指标及说明请参见基础监控。 在图表中选中某一个
认展示“接口调用”页签中“全部实例”的“URL监控”信息。 在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围:
单击“拓扑”,切换至拓扑页签,页面展示所选实例的调用趋势图。 您还可以根据需要执行以下操作: 单击“只显示组件之间调用”后的按钮,仅展示组件之间的调用。 单击“全部展开”按钮,展示所选实例一段时间的全部调用关系。 单击“重新布局”按钮,改变调用趋势图的布局。 单击刷新时间选择按钮,选择刷新方式和自动刷新的时间,默认“手动刷新”。当前支持“1分钟
作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予AOM FullAccess的系统策略,但不希望用户拥有AOM FullAccess中定义的删除应用发现规则权限,您可以创建一条拒绝删除应用发现规则的自定义策略,然后同时将AOM
作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予AOM FullAccess的系统策略,但不希望用户拥有AOM FullAccess中定义的删除应用发现规则权限,您可以创建一条拒绝删除应用发现规则的自定义策略,然后同时将AOM
认展示“全部实例”的“KafkaProducer监控”信息。 图1 查看消息队列 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围:
方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。 单击列表右上的,可以导
实例。下拉列表中显示当前账号下的所有通用实例类型Prometheus实例。 鉴权方式 访问用户侧Prometheus实例的认证方式。 基础认证:输入用户侧Prometheus实例的用户名和密码。 Token:输入访问用户侧Prometheus实例的Token。 无认证:无需认证,
去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 图1 告警降噪流程图 分组、抑制、静默需手动创建规则,创建方式见下方文档说明。 此模块只作用于消息通知部分,所有触发的告警和事件都可在告警、事件页面查看。 告警降噪中所有的规则条件均取自告警结构体中的"metadata"字段
说明: AOM的日志绕接能力是使用copytruncate方式实现的,如果选择了设置,请务必保证您写日志文件的方式是append(追加模式),否则可能出现文件空洞问题。 当前主流的日志组件例如Log4j、Logback等均已经具备日志文件的绕接能力,如果您的日志文件已经实现了