检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开源监控系统接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,通过创建Prometheus 通用实例实现开源监控系统接入AOM。 应用场景 Prometheus 通用实例类型,适合已经自建了Prometheus服务器,但需要通过远端存储(Remote Write
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
设置“规则类型”为“阈值规则”。 选择监控对象。通过以下两种方式选择: 选择资源对象:单击“选择资源对象”,通过“按资源添加”或“按指标维度添加”方式在资源树上选择待监控的资源,设置完成,单击“确定”。 监控对象最多可添加100条指标数据。 选择监控对象时,如果开启了应用到所有开关,将会针对应用或服务下的所有该
日志文件。 图3 查看容器服务日志文件 查看容器服务日志并进行分析 在左侧导航栏中选择“日志 > 日志搜索”,在“组件”页签中选择对应的集群与命名空间,选择某个组件及已配的文件名称,查看采集到的日志并进行分析。详细操作请参见搜索日志。 图4 查看容器服务日志并进行分析 父主题: 配置日志采集路径
在“Prometheus 云服务”下单击“函数工作流 FunctionGraph”卡片,在弹框中设置接入云服务的相关信息。 表1 接入云服务 参数名称 说明 示例 选择Prometheus for 云服务实例 将云服务指标接入Prometheus for 云服务实例。 企业项目:所属的企业项目。
9.0.0 64bit Kylin Kylin V10 SP1 64bit 对于Linux x86_64服务器,AOM支持上表中所有的操作系统及版本。 对于Linux ARM服务器,CentOS操作系统仅支持7.4 及其以上版本,上表所列的其他操作系统对应版本均支持。 资源使用限制
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
弹性云服务器 ECS 弹性云服务器(Elastic Cloud Server),提供安全稳定、可随时自助获取、弹性伸缩的计算服务,灵活计费,极简运维,极大降低企业成本。具体操作请参见: 弹性云服务器ECS日志接入(LTS) 弹性云服务器ECS指标接入(AOM) 裸金属服务器BMS
是否必选 参数类型 描述 appNameRule 是 Array of AppNameRule objects 服务命名部分,数组中有多个对象时表示将每个对象抽取到的字符串拼接作为服务的名称。nameType取值cmdLine时args格式为["start","end"],表示抽取命令行
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
9.0.0 64bit Kylin Kylin V10 SP1 64bit 对于Linux x86_64服务器,AOM支持上表中所有的操作系统及版本。 对于Linux ARM服务器,CentOS操作系统仅支持7.4 及其以上版本,上表所列的其他操作系统对应版本均支持。 资源使用限制
日志管理 日志管理使用说明 搜索日志 查看日志文件 添加日志桶 查看桶日志 添加日志转储 创建统计规则 接入LTS 容器日志采集配置
日志桶 日志桶是AOM对日志文件逻辑上的分组,用于创建统计规则、查看桶日志等,使用这些功能前您需先添加一个日志桶。 日志流量 日志流量指的是每秒上报的日志大小。每个租户在每个Region的日志流量不能超过10MB/s。如果超过10MB/s,则可能导致日志丢失。 桶日志 桶日志是
通过AOM监控组件进程 组件即您部署的服务,包括容器和普通进程。组件列表展示了每个组件的名称、运行状态、所属应用等信息。AOM支持从组件下钻到实例,从实例下钻到进程。通过各层状态,您可完成对组件的立体监控。 约束与限制 每个组件最多可以创建五个标签。 标签键值长度不超过36个字符,标签值长度不超过43个字符。
应用发现最佳实践 应用发现概述 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。
AOM产品结构图 托管&运行态 AOM可无缝对接多个上层运维服务,支持快速从应用管理与运维平台(ServiceStage)、函数工作流(FunctionGraph)和微服务引擎(Cloud Service Engine,CSE)等上层运维服务采集指标数据并实时、可视化呈现。 可观测性分析 基
Write地址的能力,支持将原生Prometheus的指标通过Remote Write上报到AOM服务端,即可实现时序数据的长期存储。 前提条件 已购买弹性云服务器ECS。 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 配置自建Prometheus数据上报到AOM
中间件接入AOM总览 AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持MySQL、Redis、Kafka等自建中间件指标接入AOM,并查看自建中间件日志接入LTS相关操作文档。 配置中间件接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 > 接入中心”
通过阈值规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 AOM已对接消息通知服务(Simple Message Notification,简称SMN),通过在SMN界面设置通知策略,当阈值规则的状态(正常、超限阈值、数
提供应用、主机等资源的检索功能,支持通过ID、关键字、名称等方式快速检索资源。 不支持 支持 应用管理 管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+ 组件 + 环境”的应用管理模型。 资源管理 全局查看所有的云服务资源对象与应用的关联关系,便于用户对资源进行分析和管理。 环境标签 为已创建的应用