检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CCE实例可以上报多个CCE集群数据。 开源兼容 支持自定义多维数据模型、HTTP API模块、PromQL查询。 静态文件配置和动态发现机制发现监控对象,实现轻松迁移及接入。 数据规模无上限 凭借云存储能力,数据存储无上限,不再受限于本地容量。云端分布式存储保障数据可靠性。 通过Prometheus实例
在“业务监控(基于日志)”弹框中创建日志指标规则,将上报到LTS的日志数据提取为指标来统一管理,具体操作请参见配置日志指标接入AOM。 配置ELB日志指标接入AOM AOM支持创建日志指标规则,将ELB上报到LTS的日志数据提取为指标来统一管理,便于后续在指标浏览、仪表盘界面实时监控。 约束与限制:
非华为云主机安装ICAgent后为何无数据上报? 当您在非华为云主机上安装了ICAgent后,ICAgent上报数据需要访问如下端口,如果本地有防火墙配置,请打开如下端口的出方向否则对应数据无法上报,对应功能不可用。 8149: 上报指标数据使用 8102: 上报日志数据使用 8923: 上报APM(调用链、JVM)指标使用
应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。 应用: 一个完整的业务模块,由多个组件组成。
行业竞争激烈,用户对服务的体验要求高,尤其是用户体验成为互联网企业的核心竞争力。如何能获取用户的真实体验感受,减少流失率,提升用户转化率成为企业的难题。 解决方案 AOM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,实时感知用户对应用的满意度,
覆盖用户端、服务端及云产品所有监控数据,提供从数据发现、数据展示到数据异常告警的全方位、可视化监控服务,实现从上到下、从前端到后端的全栈一体化监控。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。 精准告警 构建指标
te write上报到AOM服务端,参见将Prometheus的数据上报到AOM,实现时序数据的长期存储;也可以通过access_code作为认证凭据来查询AOM中的数据,参见通过grafana查看AOM中的指标数据,AOM支持以下原生Prometheus的API: 查询普罗(Prometheus)接口URL:
为了方便查看,可以在主机列表上方设置运行状态、主机类型、主机名称、IP地址等过滤条件,实现主机列表过滤显示。 通过开启或关闭“隐藏控制节点”开关,自定义控制节点的展示与隐藏。系统默认隐藏控制节点。 单击“隐藏控制节点”后的,可同步主机信息。 在页面右上角设置主机信息的统计条件。 设置时间范围,查看
表示long类型字段。 快速分析的字段长度最大为2000字节。 快速分析字段展示前100条数据。 单击快速分析右侧的,可以修改或者删除已添加的字段。如果您在结构化界面删除了某一字段,或者对字段名称进行了修改,快速分析会同步更新。 在快速分析的字段中,当结构化配置的字段在该时间段中不存在时,则会显示为null。
在已设的连续周期内,当某个资源的指标数据满足阈值条件时,产生一条阈值告警。 可在左侧导航栏中选择“告警管理(告警中心) > 告警列表”,在“告警”页签下查看该告警,具体请参见“查看告警”。 查看事件 在已设的连续周期内,当某个资源没有指标数据上报时,会产生一条数据不足的事件。 可在左侧导航栏中选择“告警管理(告警中心)
响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
管理Prometheus实例指标数据 使用Prometheus监控CCE集群指标 配置多账号聚合实现指标统一监控 配置CCE集群监控采集指标规则 配置预聚合规则提升指标查询效率 配置数据多写实现监控指标转储到自建Prometheus 配置指标存储时长 通过仪表盘监控Prometheus实例指标数据 配置Remote
日志搜索。 编辑yaml:通过在工作负载的yaml中spec:template:metadata:annotations:下增加以下字段来实现 kubernetes.AOM.log.relabel: '{"key1":"value1", "key2":"value2"} 自定义标签限制如下:
用Kafka高吞吐的能力,实时将数据传输给业务计算层。 数据存储:运维数据经过AOM后端服务的处理,将数据写入到数据库中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层
该日志流下日志数据分析。目前支持的SQL语句详见SQL查询语法。 依照业务需求选择不同图表类型,呈现查询结果。图表类型与配置的详细说明请参见日志数据类图表。 单击:以表格形式展示当前日志数据。 单击:以折线图形式展示当前日志数据。 单击:以柱状图形式展示当前日志数据。 单击:以饼图形式展示当前日志数据。
第三方云厂商或互联网数据中心自建Prometheus对接到AOM Prometheus实例 应用场景 云上用户经常会遇到多云或者跨region采集自建Prometheus指标数据场景。典型场景例如:将者第三方云厂商或互联网数据中心(Internet Data Center,以下简
0资源,相关指标和日志数据从上报之日起,在AOM 2.0上会自动存储一个月,一个月后系统自动删除数据,删除后相关数据将停止计费。如果用户需要继续使用相关指标和日志数据,建议采用以下方式存储: 日志数据:通过日志转储功能,将日志数据转储到OBS桶中,以便进行长期存储。日志数据的相关费用统一
集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。 约束与限制 主机状态包含“正常”、“异
编辑作业后,作业的执行方案未更新 编辑作业后不会自动同步更新该作业的执行方案。 解决方法 编辑作业后,该作业的执行方案不会自动更新,需要用户重新创建该作业的执行方案。创建执行方案的详细操作请参考作业管理。 父主题: 运维管理(即将下线)