检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建AOM日志告警规则 AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流。 已使用新版结构化功能。结构化配置请参见:日志结构化配置。 已创建相关日志流的图表。创建方法请参见:日志可视化。
查询UniAgent主机列表信息 功能介绍 该接口用于查询执行过安装UniAgent任务的主机列表信息。该接口对租户不开放,仅支持白名单服务COC使用。如其他服务有需求,可通过提交工单,申请开放此接口。 调用方法 请参见如何调用API。 URI POST /v1/uniagent
Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。 AOM有哪些优势 图3 AOM优势1 图4 AOM优势2 海量日志管理
查看每一个线程、方法、类和包的调用关系和执行效率的实时数据。 单击“Profiler性能分析”页签下的“对比”子页签,进入“对比”页面,执行如下操作: 在“对比”页面设置您想要对比的实例对象(包括实例和时间段)、性能分析类型、范围以及聚合维度,比对类型、即可以查看实例对比的性能分析数据。 图3 代码性能对比
集群名称、集群ID、区域。 数据库 关系型数据库RDS - 实例名称/ID、实例类型、数据库引擎版本、资源状态、内网IP、区域、应用环境、操作。 文档数据库DDS - 名称/ID、资源状态、实例类型、版本、企业项目、区域、应用环境、操作。 数据复制服务DRS 实时同步任务 名称/ID、
第三方云厂商或互联网数据中心自建Prometheus对接到AOM Prometheus实例 应用场景 云上用户经常会遇到多云或者跨region采集自建Prometheus指标数据场景。典型场景例如:将者第三方云厂商或互联网数据中心(Internet Data Center,以下简
放。 表1 API概览 类别 API 告警 告警相关API,包括新增、更新、删除事件类告警规则等接口。 监控 监控相关API,包括查询指标,查询、添加监控数据等接口。 Prometheus监控 prometheus监控相关API,包括区间数据查询、瞬时数据查询等接口。 日志 日志相关API,包括查询日志接口。
传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 约束与限制 如需使用“应用资
单击“实时日志”页签,查看对应的实时日志。实时日志每隔5秒更新1次,在日志消息区域,最多需要等待1分钟左右,即可查看实时上报的日志。 如果您正在使用实时查看功能,请停留在实时查看页面,请勿切换页面。如果离开实时查看页面,实时查看功能将会停止,重新开启后上一次查看的实时日志将不会
原因。 图2 应用服务整体错误率突增 TopN接口平均响应时间突增:基于应用的调用链数据,针对接口粒度提供调用链响应时间分析,快速定位根因。 图3 TopN接口平均响应时间突增 TopN接口错误率突增:基于应用的调用链数据,针对接口粒度提供调用链错误率分析,快速定位根因。单击“查
通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 告警规则分为阈值规则和事件类告警规则两种。通常情况下,通过阈值规则,实时监控环境中主机、组件等资源使用情况。当资源使用
ReadOnlyAccess:企业项目管理服务只读权限 单击模板上的“编辑”可将AOM系统监控数据(如告警数据、Prometheus监控数据等),呈现在业务指标监控大屏页面上,详情请参见监控AOM系统指标数据。 根据自身实际业务的需求,您还可以自定义大屏页面呈现的内容,详情请参见自定义业务指标监控大屏。
0资源,相关指标和日志数据从上报之日起,在AOM 2.0上会自动存储一个月,一个月后系统自动删除数据,删除后相关数据将停止计费。如果用户需要继续使用相关指标和日志数据,建议采用以下方式存储: 日志数据:通过日志转储功能,将日志数据转储到OBS桶中,以便进行长期存储。日志数据的相关费用统一
Debugging诊断概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK
ICAgent安装成功但是数据采集失败 解决方法 若ICAgent未安装成功,请重新安装ICAgent。 若ICAgent安装成功,但是无法监控到主机,通常有几种原因: 配置错误:Region名错误,或PODLB地址错误。 数据采集失败:调openstack接口失败,或采集的hostid为空。
不支持基于CMDB模型,对指标数据分层监控。 支持 容器洞察 从工作负载和集群2个维度监控CCE的资源使用、状态和告警等信息,以便快速响应,保证工作负载顺畅运行。 支持 支持 指标浏览 实时监控日志数据和各资源的指标数据及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看业务及分析数据关联分析。
ometheus数据采集和数据存储分析的逻辑单元。 Prometheus探针 部署在用户侧或者云产品侧Kubernetes集群。负责自动发现采集目标、采集指标和远程写到其他库。 Exporter 一个采集监控数据并通过Prometheus监控功能规范对外提供数据的组件。目前有上百个官方或者第三方
安装UniAgent 统一数据采集Agent(简称UniAgent)完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,可在接入中心安装对应的插件,并创建采集任务,来进行指标数据采集。 AOM支持为
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警”
appDiscoveryRule delAppDiscoveryRule 创建数据订阅规则 apminventory createSubscribeRule 验证dms连通性 apminventory verifyConnect 删除数据订阅规则 apminventory deleteSubscribeRule