检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开通智能洞察 AOM智能洞察引擎持续监控您的应用和资源,通过历史数据和问题特征发现问题,并针对每个问题会给出相应的根因分析和建议。 功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。
了托管式的CCE类型Prometheus实例 ,适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。CCE Prometheus实例默认提供对容器服务CCE集群的Prometheus云原生监控插件的集成。为CCE集群安装云原生监控插件后,指标将自动上报指标到指定的CCE Prometheus实例中。
命令中包含mkfs.ext3 /dev/xdxxx,块设备会被格式化,直接让你的系统达到不可恢复的阶段 umount command \\s*umount\\s+.* umount -v /dev/sda1 可能影响系统或服务的正常运行 poweroff command \\s*poweroff\\s*
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需
云服务实例过滤显示。 单击右上角的,可实时获取到该云服务全部实例的最新信息。 单击任一实例名称,在对应实例页签中监控云服务实例各指标的数据曲线。 在页面右上角设置指标信息的统计周期,查看不同时间段的历史数据。 设置时间范围,查看已设时间范围内上报的指标。可通过如下两种方式设置时间范围:
告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上报的信息,
通过全局拓扑图查看应用间调用关系 拓扑图的每根线条代表服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图线条,可以查看该调用关系的趋势图;同时拓扑图也会展示中间件的调用关系。通过拓扑图,一方面可以自动梳理服务之间的调用关系,同时也可以从全局视角查看服务
件监控”的主操作界面。 在“实例列表”页签,可查看该组件所有实例的概况。 单击实例名称,可监控业务进程或组件pod的资源占用与健康状态。 在“主机列表”页签,可查看该组件所在的主机概况。 在“告警分析”页签,可查看该组件的告警情况。 单击“监控视图”页签,可监控该组件的各种指标。
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题
日志 当日志数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 通知规则类型 通知规则的类型,当前仅华南-广州区域常见告警通知规则时支持设置此参数。 Prometheus监控 当指标或事件满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。
了解 AOM是云上应用的一站式立体化运维管理平台。 产品介绍 什么是AOM 应用场景 与其他服务的关系 约束与限制 指标总览 基本概念 03 入门 快速了解AOM服务在不同应用场景中的操作流程。 快速入门 监控云容器引擎 CCE的指标 05 实践 提供典型场景的最佳实践操作指导您更好地使用AOM。
单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 图3 新增PodMonitor 配置完成后,新增的采集规则将显示在下方的列表中。 图4 配置采集规则 其他相关操作 CCE集群的指标管理配置完成后,您还可以执行表1中的操作。 表1 相关操作
for ECS实例,并在AOM的接入中心安装node-exporter或自建中间件。 配置完成后,单击“保存”。 全采样设置 为了减少调用链数据频繁上报给服务造成的性能影响,APM探针侧发送的调用链数据,默认情况下以最大100TPS的速率上报。在服务并发量超过100TPS的情况下,
AOM 2.0控制台入口 LTS控制台入口 参考文档链接 配额设置 当日志超过每月免费赠送的额度(500M)时,超过的部分将按需收费。如果每月免费赠送的额度已经可以满足您的使用需求,超过后希望暂停日志收集,可以在配置中心进行设置。 登录AOM 2.0控制台。 在左侧导航栏选择“设置”,进入全局配置界面。
运维通道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来,提升运维操作的质量和效率,帮助企业运维转型和运维价值提升。
查看组件调用链监控项 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截对应请求及后续一系列的调用信息。本章节主要介绍如何查看某个组件的调用链情况。 查看组件调用链 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“
oaded JobManager自JVM启动以来加载的类的总数。 无 flink_jobmanager_Status_JVM_ClassLoader_ClassesUnloaded JobManager自JVM启动以来卸载的类的总数。 无 flink_taskmanager_St
告警管理使用说明 告警是指AOM自身或外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。
填写规则的描述信息。 图1 设置告警基本信息 设置告警规则的详细信息。 设置“规则类型”为“事件类告警”。 设置告警来源、触发对象和触发策略。 表1 告警规则填写说明 参数名称 填写说明 告警来源 事件类告警来源的服务名称,从现有的服务列表中选择。 触发对象 服务事件的筛选条件。
心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点的采样周期为15s,则一分钟的时间范围内,上报的采样点数据的总条数为:3*(60/15)=12(条),如下图所示: 会产生自定义指标上报的场景:接入Prometheus后,为什么会产生额外费用?。 指标存储时长