检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开源监控系统接入AOM Prometheus API/SDK接入 应用运维管理AOM API 指标 通过API接入相关的指标数据。 Prometheus 自定义插件接入 Prometheus自定义插件 指标 自定义插件接入AOM 日志接入 云服务、自建软件、APIs/SDKs、跨账号接入-日志流
应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角分析关联指标和告警数据,直击异常。 生态开放 开放了运营、运维数据查询接口和采集标准,支持自主开发。
部署在用户侧或者云产品侧Kubernetes集群。负责自动发现采集目标、采集指标和远程写到其他库。 Exporter 一个采集监控数据并通过Prometheus监控功能规范对外提供数据的组件。目前有上百个官方或者第三方 Exporter可供使用,具体请参见Exporter详情。 Job 一组Target的配置
ICAgent采集数据 给主机安装ICAgent(插件式的数据采集器)并通过ICAgent上报相关的运维数据。 API接入数据 通过AOM提供的OpenAPI接口或者Exporter接口,将业务指标作为自定义指标,接入到AOM。 传输存储层 数据传输:AOM Access是用来接收运维数据
Debugging诊断概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK
管控要求。例如:针对ECS服务,管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。多数细粒度策略以API接口为粒度进行权限拆分,AOM支持的API授权项请参见策略和授权项说明。 如表1所示,包括了AOM的所有系统权限。 表1 AOM系统权限 策略名称 描述 类别
可观测大屏监控 运维可观测大屏是基于华为云Astro低代码平台开发的面向不同场景、角色的运维监控大屏,基于现网质量、服务韧性、评估优化等N大主题域,通过运维数据建模、可视化等数据分析能力,提供企业级运维沙盘。满足您全场景、自动化、可量化、可观测的一体化监控解决方案,为业务健康和稳定保驾护航。
eus数据 Prometheus监控提供了Remote read接口,该接口支持将一系列Prometheus协议的数据源组织为单一数据源查询。本节介绍如何使用自建Prometheus,通过Remote read接口读取AOM Prometheus实例的数据。 前提条件 服务已接入可观测Prometheus
metheus的API: 查询普罗(Prometheus)接口URL: GET /v1/:project_id/api/v1/query GET /v1/:project_id/api/v1/query_range GET /v1/:project_id/api/v1/labels
管理AccessCode AccessCode是调用API的身份凭据。通过创建AccessCode可为当前用户配置API服务的调用权限。该权限设置针对整个AOM 2.0服务生效。 约束与限制 每个用户最多可创建2个AccessCode。 AccessCode删除后将无法恢复,请谨慎操作。
加载性能 API请求 API请求分别展示API失败率趋势图、调用平均耗时趋势图、API请求列表以及请求状态码分布。 登录AOM 2.0控制台。 在左侧导航栏选择“Web监控 > API请求”。 登录APM控制台。 在左侧导航栏选择“Web监控 > API请求”。 API请求 JS错误
通用配置)”中字节码方式采集被停止。 如果长时间未采集到指标数据,可能的原因有: java9启动提示找不到sql.time类 原因分析:APM探针开发环境为jdk1.7,而java 9模块化后,sql包不会默认提供,需要应用引入模块。 出现概率:有条件出现。 规避措施:如果出现该问题,组件在module-info
提供典型场景的最佳实践操作指导您更好地使用AOM。 最佳实践 AOM最佳实践汇总 06 API 您可以使用本文档提供的API对应用运维管理服务进行相关操作,例如创建、删除、查询等。 API文档 API概览 如何调用API 监控相关接口 日志相关接口 告警相关接口 权限策略与授权项 错误码 02 购买 AOM提供基础版、按需版两种计费方式。
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
修订记录 表1 版本说明列表 发行时间 更新说明 2022-04-16 告警降噪功能优化。 2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告
磁盘指标及其维度 表1 磁盘指标 指标名称 指标含义 取值范围 单位 磁盘读取速率(aom_node_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) 磁盘写入速率(aom_node_disk_write_kilobytes)
ICAgent管理(华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
参考信息 Agent包下载配置
升级AOM 手动升级 一键迁移
云审计服务支持的关键操作 云审计服务支持的AOM操作列表 在CTS事件列表查看云审计事件