正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用的Grafana监控大盘。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“接入中心”,单击“Prometheus 中间件”面板的“MongoDB”卡片。 在配置页面中,参
用的Grafana监控大盘。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 操作步骤 登录AOM 2.0控制台。 左侧导航栏选择“接入中心”,单击“Prometheus 中间件”面板的“PostgreSQL”卡片。 在配置页面中
用的Grafana监控大盘。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 操作步骤 登录AOM 2.0控制台。 左侧导航栏选择“接入中心”,单击“Prometheus 中间件”面板的“Kafka”卡片。 在配置页面中,参考下表配置相关参数信息,并单击“下一步”。
基本概念 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都
接入Prometheus后,为什么会产生额外费用? CCE容器场景 通常情况下,用户购买CCE集群,部署工作负载之后,默认会采集cluster、Pod、Container、Node等基础指标-容器指标,基础指标的上报不产生费用。 产生计费的可能原因是: Prometheus实例内
功能特性 Prometheus监控具有监控数据采集、存储、计算、展示、告警等能力。监控指标覆盖广,涵盖容器、云服务、中间件、数据库、应用以及业务等多种监控数据。本文介绍Prometheus 监控支持的主要功能。 表1 监控对象接入 功能 功能说明 创建Prometheus实例 支
景查看。 注意事项 作业管理最多可以创建1000个作业。 每个作业最多支持创建20个全局参数、20个作业步骤、50个执行方案。 创建作业 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“作业管理”,单击“新建作业”。
单个用户最多可创建100个日志指标规则,所有规则中添加的指标总数不能超过100。 前提条件 已将ELB日志接入LTS。 创建日志指标规则 登录AOM 2.0控制台。 在左侧导航栏中选择“业务监控(BETA) > 业务指标”,单击页面右上角“返回旧版”。 在“日志指标规则”后单击,进入创建日志指标规则页面。
配置告警行动规则:配置告警处理策略,如应用异常时自动重启。 当前“概览”功能默认关闭,如需使用,需提前在“菜单开关”中开启概览的开关,详细操作请参见菜单开关。 创建应用 登录AOM 2.0控制台。 在左侧导航栏单击“概览”,即可进入“概览”页面。 在“概览”页面切换为“应用视角”。 图1 切换视角 在快速入门区
主机状态包含“正常”、“异常”、“亚健康”、“通道静默”、“已删除”。当由于网络异常、主机下电、关机等原因导致的主机异常,或主机产生阈值告警时,主机状态为“异常”。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“基础设施监控 > 集群监控”。 在页面右上角设置集群信息的统计条件。 设置时间范围,查看已设时
ICAgent和UniAgent是同一个插件吗? ICAgent属于插件,UniAgent不属于插件,二者不是同一个含义。 UniAgent:UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座,为AOM提供指令下发,如脚本下发和执行,用于插件集成(IC
最佳实践概述 本章汇总呈现应用运维管理 AOM的最佳实践。 建设完整指标体系,实现立体化监控 通过告警降噪清除告警风暴 通过多账号聚合Prometheus实例实现指标数据统一监控 自建中间件接入(CCE容器场景) PostgreSQL Exporter接入 MySQL Exporter接入
按全量指标和按Prometheus命令创建指标告警规则时支持秒级监控,指标告警的时效性取决于指标上报周期、规则检查频率及通知发送耗时。 按全量指标创建指标告警规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警规则”。 单击“创建” 。 设置告警规则基本信息,具体的参数说明如表1所示。
定时任务无法成功触发 问题描述 系统无法触发定时任务(按确定时间或周期定时触发脚本执行、文件管理、服务场景以及作业管理等操作)。 可能原因 账号欠费、冻结或受限,会导致定时任务无法正常触发。 解决方法 账号欠费:客户欠费后,为防止相关资源不被停止或者释放,需要客户及时进行充值,详细说明请参见:欠费还款。
主机监控 主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICAgent,
搜索应用时,系统提示“AOM.11007006: get policy list failed.” 问题描述 在应用资源管理的“首页”界面进行资源检索时,系统提示“AOM.11007006: get policy list failed.” 可能原因 当前用户账号已欠费或者被冻结,导致没有应用资源管理的操作权限。
应用场景 AOM应用广泛,下面介绍AOM的两个典型应用场景,以便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监
创建方式 按照配置方式的不同,创建日志告警规则可分为:按关键词统计创建、按搜索分析创建、按SQL统计创建。 按搜索分析创建日志告警规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警规则”。 在右侧区域选择“日志”页签,然后单击“创建”。 在“创建日志告警规
计费概述 通过阅读本文,您可以快速了解应用运维管理AOM 2.0的计费模式、计费项、欠费等主要计费信息。 如果已知资源使用情况,需了解价格预算和计费方式选择,可前往价格计算器预算价格。 计费模式 AOM当前提供按需计费模式,按需计费是一种后付费模式,即先使用再付费,按照云服务器实
服务场景概述 服务场景会按照场景分类展现对应的已上架的工具卡片,可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作。如果不需要对卡片做下架操作,请参考自动化运维自定义策略,拒绝卡片下架操作。具体操作如表1。 表1 相关操作 操作 说明 收藏卡片 单击待收藏卡片上的。 下架卡片