检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
管理资源分组 删除资源分组 当您不再需要某个资源分组时,可以对其执行删除操作。 资源分组关联告警模板 用户可通过创建资源分组关联告警模板的方式进行批量创建告警规则,提升告警规则配置效率。 登录AOM 2.0控制台。 在左侧导航栏选择“云监控 > 资源分组”。 登录CES控制台。 在左侧导航栏选择“资源分组”。
单击“操作”列的“编辑”。 删除分组规则 删除单条规则:单击对应规则“操作”列的“删除”。 删除单条或多条规则:勾选对应规则前的复选框,单击“批量删除”。 搜索分组规则 在右上角的搜索框中输入规则名称关键字,单击后显示匹配对象。 父主题: 配置AOM告警降噪
0控制台,在左侧导航栏中选择“设置”,进入“全局配置”界面。 在左侧导航栏中,选择“UniAgent安装与配置”,选择待安装ICAgent的主机,单击“插件批量操作”。 在弹出的对话框中,操作类型选择“安装”,选择插件为“ICAgent”,插件版本选择“5.12.163”,在“ak”、“sk”中输入1获取的AK/SK。
aom:alarmRule:get 查询阈值规则 根据ID查询单个阈值规则或者查询所有阈值规则 aom:alarmRule:delete 删除阈值规则 批量删除阈值规则或者根据ID删除单个阈值规则 aom:discoveryRule:list 查看应用发现规则 查询系统中已有应用发现规则 ao
见分组规则。 图3 设置告警降噪方式 单击“立即创建”,完成创建。如下图所示,创建了一条阈值规则,单击其前的,可对其下的多个资源的同一指标批量监控。 在展开的列表中,只要某个主机的指标数据满足设置的告警条件时,在告警界面就会生成一条阈值告警,您可在左侧导航栏中选择“告警> 告警列
删除告警行动规则(告警通知规则) 删除单条规则:单击对应规则“操作”列的“删除”,随后在提示页面单击“确定”即可删除。 删除单条或多条规则:勾选对应规则前的复选框,单击“批量删除”,随后在提示页面单击“确定”即可删除。 删除告警行动规则(告警通知规则)时需要注意以下事项: 删除告警行动规则(告警通知规则)前需要
删除单条消息模板:单击对应规则“操作”列的“删除”,随后在提示页面单击“确定”即可删除。 删除单条或多条消息模板:勾选对应规则前的复选框,单击“批量删除”,随后在提示页面单击“确定”即可删除。 删除消息模板前需要先删除消息模板绑定的告警行动规则(告警通知规则)。 搜索消息模板 在右上角
查询条件(支持添加3条查询语句。) 日志组名称:选择已创建的日志组。 日志流名称:选择已创建的日志流。 当日志组下有多个日志流时,支持选择多个日志流,即可批量创建搜索分析类型的告警。 查询时间:指定语句的查询周期。查询语句的时间范围:从当前时间往前推一个周期。例如:查询时间设置为1小时,当前时间
为空 ci_id 否 String 节点id列表;如果ci_ids和ci_id同时有,则优先ci_ids,但是不能同时为空。但是不支持应用批量查询 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 data Array of objects 分页查询的数据。
在控制台查看不到日志怎么办? 问题描述 在AOM控制台查不到日志。 可能原因 未安装ICAgent日志采集工具。 采集路径配置错误。 AOM控制台上的“日志采集开关”未开启。 AOM控制台上的“超额继续采集日志”开关未开启。 当前账号欠费,故采集器停止采集。 日志流写入速率和单行日志长度超出使用限制。
开通智能洞察 AOM智能洞察引擎持续监控您的应用和资源,通过历史数据和问题特征发现问题,并针对每个问题会给出相应的根因分析和建议。 功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。
页面,在仪表盘页面左上角,单击仪表盘名称,将光标移至待操作的仪表盘名称后的上,选择“移动分组”。 批量移动仪表盘分组:在仪表盘列表选中多个仪表盘前的复选框,单击“移动分组”按钮可批量修改仪表盘分组。 删除仪表盘 在仪表盘列表选择一个仪表盘,单击“操作”列的“删除”。 在仪表盘列表
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维
基础指标:CSE指标 介绍CSE服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 表1 CSE服务监控指标 指标类别 分类 指标 指标名称 指标含义 取值范围 单位 ServiceComb registry servicecomb_service_center_db_service_total
通过AOM查看事件巡检数据 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小
自动化运维 表1 自动化运维基本概念 术语 说明 脚本管理 支持Shell、Python、Bat、Powershell脚本语言以及单个脚本的多版本管理。 作业管理 将脚本和文件原子操作进行多步骤编排形成作业模板,用于完成特定运维自动化场景操作。例如初始化业务环境。 执行方案 从作
运维管理 运维管理概述 开通自动化运维 自动化运维权限管理 服务场景 管理定时运维 管理任务 配置参数库 管理作业 管理脚本 管理文件 运维配置 管理工具市场 高危命令说明
产品架构 AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集
产品优势 兼容开放 支持各类开源协议低门槛接入,开放了运营、运维数据查询接口和采集标准,提供全托管、免运维、低成本的云原生监控能力。 开箱即用 无需修改业务代码即可接入使用, 非侵入式数据采集,安全无忧。 丰富的数据源 融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源。
应用场景 AOM应用广泛,下面介绍AOM的两个典型应用场景,以便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监