检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
AOM提供多场景、多层次、多维度指标与日志数据的监控能力,通过旧版接入中心快速接入需要监控的指标和日志,接入完成后,即可方便地在“指标浏览”页面查看相关资源或应用的运行状态、各个指标的使用情况、接入的日志等信息。 约束与限制 如果您进入的是新版接入中心,需要单击“接入中心”页面右上角“返回旧版”返回至旧版接入中心页面。
查询指标 功能介绍 该接口用于查询系统当前可监控的指标列表,可以指定指标命名空间、指标名称、维度、所属资源的编号(格式为:resType_resId),分页查询的起始位置和返回的最大记录条数。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ams/metrics
Prometheus实例的名称,进入实例的详情页面。 在左侧导航栏中单击“仪表盘”,即可查看当前Prometheus实例下系统预置的所有仪表盘模板。 根据需要,单击对应仪表盘模板名称,即可监控当前Prometheus实例的指标数据。 例如,需要监控主机的磁盘分区信息,则单击“di
描述 分组规则的描述。最多不能超过1024个字符。本示例可不填写。 - 分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。 告警源:触发告警或事件的服务名称。可以设置为AOM
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring
s) 还未经使用的磁盘空间。 ≥0 兆字节(MB) 磁盘空间容量(aom_cluster_disk_capacity_megabytes) 总的磁盘空间容量。 ≥0 兆字节(MB) 磁盘使用率(aom_cluster_disk_usage) 已使用的磁盘空间占总的磁盘空间容量百分比。
对未执行的任务单击“操作”列的“去执行”。 对已执行的任务单击“操作”列的“重新执行”。 删除任务 单击在“操作”列的“删除”,删除任务。 只有未执行过的任务行,"操作"列,才会显示“删除”。 搜索任务 支持按企业项目、任务名称、执行人、任务类型、任务状态搜索。在右上角的搜索框中输入关键字,单击后在下面任务列表显示匹配对象。
取消选中可选列前的单选框,自定义可选列的展示与隐藏。 单击列表右上的,可以导出当前页的列表信息,最大支持导出100条。 单击“当前线程数”、“busy线程数”、“busy线程数峰值”等列的蓝色字体数值,可以查看所选时间段内该Web容器的趋势图。 单击“版本”列的版本信息,可以查看对应版本详情。
开通智能洞察 AOM智能洞察引擎持续监控您的应用和资源,通过历史数据和问题特征发现问题,并针对每个问题会给出相应的根因分析和建议。 功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。
这些特征的类别。图1以集群指标为例,介绍了命名空间、维度和指标的关系。 图1 集群指标 AOM的基础版和按需版所对应的指标存储时长及计费方式不同,详见收费详情。 主机 AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云购买的虚拟机(例
创建统计规则 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。
介绍IEF服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标 指标名称 指标含义
如何为执行方案配置审批? 无法单独为执行方案配置审批,执行方案会继承作业的审批配置。 解决方法 在创建作业时,对该作业设置“审批配置”(默认关闭),则由该作业创建的执行方案执行时就需要审批。创建作业的详细操作请参考作业管理。 父主题: 运维管理(即将下线)
时区 定时任务的时区,可以在下拉列表中选择正确的时区。 执行策略 定时任务的执行策略,包含以下三种: 单次执行:在设置的时间执行一次操作。 简单周期执行:根据设置的时间周期循环执行。 周期执行(Cron表达式):根据设置的Cron表达式执行操作。 执行时间 定时任务执行的具体时间。 执行周期
方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。 单击“只显示组件之间调用”后的按钮,仅展示组件之间的调用。 单击“全部展开”按钮,展示所选组件一段时间的全部调用关系。 单击组件之间的连线,会在右侧显示详细的请求数、平均RT、错误率等数据。 右键单击某一个组件图标,选择 “查看调用链
通过全局拓扑图查看应用间调用关系 拓扑图的每根线条代表服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图线条,可以查看该调用关系的趋势图;同时拓扑图也会展示中间件的调用关系。通过拓扑图,一方面可以自动梳理服务之间的调用关系,同时也可以从全局视角查看服务
资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集器)并通过ICAgent上报相关的运维数据。 API接入数据
左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围,您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围。 在过滤器上方的下拉列表中选择需要查看的应用。 单击事件卡片或列表进入该事件详情页面,查看事件的故障传播链。 故障传播链将展示调用链中的故障传播图谱,您可通过故障
在过滤器上方的下拉列表中选择需要查看的应用。 单击事件卡片或列表进入该事件详情页面,查看各类型事件的根因分析。 应用服务整体平均响应时间突增:基于应用的调用链数据,针对应用粒度提供下钻分析,分析应用下每个组件的平均时延以快速定位根因,找到导致应用整体RT突增的具体组件。 图1
告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上报的信息,