检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警”
用监控(数据库和中间件),来确保服务器与应用的正常健康运行,进而保证关键业务系统的高可用性和性能。 该方案构建云上的SAP应用监控系统,提供了如下几种应用监控特性: 提供基于Netweaver ABAP 和 Netweaver JAVA的SAP应用系统平台、HANA数据库的监控;支持SUSE操作系统。
应用运维管理 应用运维管理(简称AOM)是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。 了解服务 立即使用 成长地图 由浅入深,带您玩转AOM
、实例等维度快速过滤。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角分析关联指标和告警数据,直击异常。 生态开放 开放了运营、运维数据查询接口和采集标准,支持自主开发。
方式,采集日志后,日志数据可以在控制台界面以简单有序的方式展示、方便快捷的方式进行查询。 登录AOM 2.0控制台。 在左侧导航栏选择“日志分析 > 日志接入”。 登录LTS控制台。 在左侧导航栏选择“日志接入”。 日志接入 日志转储 主机和云服务的日志数据上报至AOM或LTS后
Bandwidth 表示通过PCIe总线传输/接收的数据速率,包括协议标头和数据有效负载。 该值表示一个时间间隔内的平均值,而不是瞬时值。 该速率在时间间隔内平均。例如,在1秒内传输1 GB数据,则无论以恒定速率还是突发传输数据,速率都是1 GB/s。理论上的最大PCIe Gen3带宽为每通道985
告警相关API,包括新增、更新、删除事件类告警规则等接口。 监控 监控相关API,包括查询指标,查询、添加监控数据等接口。 Prometheus监控 prometheus监控相关API,包括区间数据查询、瞬时数据查询等接口。 日志 日志相关API,包括查询日志接口。 Prometheus实例 Prom
String 状态 表4 rule字段数据结构说明 参数名称 参数类型 描述 name String 策略名称。 conditions 参见表5 匹配条件具体内容。 actions 参见表6 指定策略匹配成功后执行的动作。 表5 conditions字段数据结构说明 参数名称 参数类型 描述
ometheus数据采集和数据存储分析的逻辑单元。 Prometheus探针 部署在用户侧或者云产品侧Kubernetes集群。负责自动发现采集目标、采集指标和远程写到其他库。 Exporter 一个采集监控数据并通过Prometheus监控功能规范对外提供数据的组件。目前有上百个官方或者第三方
通常来源于组件性能图表或接口性能数据。 接口调用次数、请求平均时延、错误调用次数、请求吞吐量等 接入应用层指标 中间件指标 通常来源于原生中间件或云中间件数据。 文件系统容量、文件系统使用率等 接入中间件指标 基础设施层指标 通常来源于容器或云服务相关数据,例如计算、存储、网络、数据库等。 CPU使用率、内存使用率、健康状态等
Key)包含访问密钥ID(AK)和秘密访问密钥(SK)两部分,是您在华为云APM服务的长期身份凭证,JavaAgent携带密钥ID(AK)上报数据,华为云通过该AK识别访问用户的身份,通过SK对请求数据进行签名认证,用于确保上报请求的机密性、完整性和请求者身份的正确性。 登录AOM 2.0控制台。 在左侧导航栏选择“APM配置
函数工作流 FunctionGraph 存储 对象存储服务 OBS 网络 弹性公网IP和带宽、弹性负载均衡 ELB、NAT网关 NAT 数据库 关系型数据库 RDS 应用中间件 分布式消息服务 DMS分布式缓存 DCS 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“基础设施监控
”文本框中删除对应的成员账号。 接入云服务:从云服务下拉列表中选择需要监控的一个或多个云服务。 数据存储:组织内子账号指标数据接入Prometheus For聚合实例后,子账号保留数据。系统默认不选择。 添加云服务支持的相关指标:单击“新增指标”,依次为接入的云服务添加相关指标。
应用示例 查询时间序列 查询时序数据 查询指定告警行动规则详细信息
内满足搜索条件的事件。 您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看事件统计数据 单击“事件分布图”,可通过柱状图查看在指定时间范围内和搜索条件下事件的统计数据。 - 父主题: 告警管理
内满足搜索条件的告警。 您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看告警统计数据 单击“告警分布图”,可通过柱状图查看在指定时间范围内和搜索条件下告警的统计数据。 - 清除告警 在当前告警列表中单击目标告警所在“操作”列中的。 告警故障已经解除时可进行清除操作。
该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets) 每秒网卡接收的数据包个数。 ≥0 个/秒(Packet/s) 下行错包率(aom_node_network_receive_error_packets) 每秒网卡接收的错误包个数。
设备数量 ≥0 个 NB数据上报数 iotda_south_dataReport_totalCount NB数据上报总数 统计当前实例/资源空间下NB数据上报总次数 ≥0 次 iotda_south_dataReport_successCount NB数据上报成功次数 统计当前实例/资源空间下NB数据上报成功次数
取值范围:0min-15day,推荐设置为1h。 步骤二:创建全量指标告警规则 通过指标告警规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 按照配置方式的不同,创建指标告警规则可分为两种:按全量指标创建和按Prometheus命令创建。下
安全 责任共担 身份认证与访问控制 数据保护技术 审计与日志 服务韧性 监控安全风险 认证证书