检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
析等能力,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。APM提供了用户体验管理、分布式性能追踪、事务分析等能力,可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。AOM提供基础运维能力,APM是对AOM运维能力的补充
对象存储服务 对象存储服务(Object Storage Service,简称OBS)是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力,包括:创建、修改、删除桶,上传、下载、删除对象等。 AOM支持将日志转储到OBS的桶中,以便长期存储。 云日志服务
产品架构 AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集
单击“下一步”,进入“授权”页面。 在“选择策略”页签选择“DMS UserAccess”策略,并单击“下一步”。 DMS UserAccess策略:分布式消息服务普通用户权限(无实例创建、修改、删除、扩容、转储)。 在“设置最小授权范围”页签设置授权范围方案为“指定区域项目资源”,并在下方“项目[所属区域]”选定生效区域。
对象存储服务 对象存储服务(Object Storage Service,简称OBS)是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力,包括:创建、修改、删除桶,上传、下载、删除对象等。 AOM支持将日志转储到OBS的桶中,以便长期存储。 云审计服务
应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体验、如何将散落的日志进行关联分析、如何快速追踪问题。
)、关系型数据库(RDS)、分布式缓存服务(DCS)、云硬盘(EVS)、对象存储服务(OBS)、文档数据库服务(DDS)、弹性文件服务(SFS)、消息通知服务(SMN)、分布式消息服务(DMS)、数据接入服务(DIS)、实时流计算服务(CS)、分布式数据库中间件(DDM)、API网关(APIG)、图引擎服务(GES)
为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM 2.0服务生效。 前提条件 用户已被授予“AOMFullAccessPolicy
为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。 前提条件 AOM已在统一身份认证服务IAM为您创建名为“
订阅目标类型选择“分布式消息服务DMS”,请参考表3配置参数。 表3 数据订阅规则参数说明 参数 说明 示例 规则名称 订阅规则名称 输入:aom-kafka-test。 订阅内容 支持“指标”和“告警”。 选择:指标。 订阅目标类型 选择“自定义Kafka”或“分布式消息服务DMS”。
在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中选择“数据订阅”,单击“创建订阅规则”,根据实际需求,选择订阅内容为“分布式消息DMS订阅”或“Webhook”。 订阅内容选择“分布式消息服务DMS”。 请参考表1配置参数,设置相关参数后,单击“确定”。 表1 数据订阅规则参数说明 参数 说明
适合已自建了Prometheus Server,但需要通过远端存储(Remote Write)方式来解决Prometheus存储的可用性和可扩展性场景。具体操作请参见:接入指标(AOM)。 KAFKA协议 高吞吐、分布式、基于TCP的二进制消息系统协议。具体操作请参见:接入日志(LTS)。
500MB 400GB 1TB 日志存储空间 500MB 400GB 1TB 主机监控 指标存储7天 100VM,指标存储时长1年 200VM,指标存储时长1年 CCI实例监控 指标存储7天 500实例,指标存储时长1年 1000实例,指标存储时长1年 秒级监控指标数量 首月免费10个
表1 云服务监控 类别 云服务名称 计算 函数工作流 FunctionGraph 存储 对象存储服务 OBS 网络 弹性公网IP和带宽、弹性负载均衡 ELB、NAT网关 NAT 数据库 关系型数据库 RDS 应用中间件 分布式消息服务 DMS分布式缓存 DCS 操作步骤 登录AOM
使用Remote Read地址和Remote Write地址,将自建Prometheus的监控数据存储到AOM的Prometheus实例中,实现远程存储。 预聚合 通过配置预聚合规则将计算过程提前到写入端,可减少查询端资源占用,尤其在大规模集群和复杂业务场景下可以有效的降低PromQ
GET方法查询瞬时数据 功能介绍 该接口使用GET方法查询PromQL(Prometheus Query Language)在特定时间点下的计算结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/query 表1 路径参数
API模块、PromQL查询。 静态文件配置和动态发现机制发现监控对象,实现轻松迁移及接入。 数据规模无上限 凭借云存储能力,数据存储无上限,不再受限于本地容量。云端分布式存储保障数据可靠性。 通过Prometheus实例 for 多账号聚合实例将多个资源账号的指标数据汇聚到一个Prometheus实例,实现统一监控。
2元/GB 计费示例 以自定义指标上报量使用场景为例。 下面的价格仅为示例,实际计算请以价格计算器中的价格为准。 假设您有1台服务器,每天自定义上报800百万条指标,则按照计费公式,分3个区间计费,费用计算如下: 0~150(百万条):0.7*150 150~600(百万条):0.5*450
规则。一个规则组可以包含多条规则。 record 规则的名称。聚合规则的名称必须符合 Prometheus指标名称规范。 expr 计算表达式。Prometheus监控将通过该表达式计算得出预聚合指标。计算表达式必须符合PromQL。 labels (可选)指标的标签。 配置后的Recording Rule示例如下: