检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。 告警清除:支持单个、批量清除告警。 告警详情:在告警详情中查看告警对象的信息和修复建议,所有的告警都提供修复建议。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警列表”。 单击“告警”页签,查看告警信息。
除”。 删除单条或多条规则:勾选对应规则前的复选框,单击“批量删除”。 搜索分组规则 在右上角的搜索框中输入规则名称关键字,单击后显示匹配对象。 父主题: 告警降噪
使用流程 应用运维管理(Application Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。
是否必选 参数类型 描述 appNameRule 是 Array of AppNameRule objects 服务命名部分,数组中有多个对象时表示将每个对象抽取到的字符串拼接作为服务的名称。nameType取值cmdLine时args格式为["start","end"],表示抽取命令行
说明请参见日志数据类图表。 对查询结果可执行以下操作: 单击“新建”,在弹出的“创建可视化图表”中,根据业务需求填写“图表名称”、“可视化对象”,选择需要展示的“图表类型”,单击“确定”,可视化图表保存成功。 单击“保存”,在弹出的“保存可视化图表”对话框中,根据业务需求填写“图
不区分大小写 name 是 String 组件名称 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 id String 对象id 状态码: 400 表4 响应Body参数 参数 参数类型 描述 error_code String AOM.30005001 error_msg
GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分内容。当资源不存在的时候,PATCH可能会去创建一个新的资源。
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
OVERY、CONSOLE,默认值:API 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 id String 对象id 状态码: 400 表4 响应Body参数 参数 参数类型 描述 error_code String AOM.30005001 error_msg
namespace or alarm name is invalid, or the project ID is left blank. 命名空间无效、项目ID为空或者告警名称无效 请检查对应的参数是否符合要求。 400 SVCSTG_AMS_4000102 The inventory
gin、kube-dns、org.tanukisoftware.wrapper.WrapperSimpleApp、evs-driver、obs-driver、sfs-driver、icwatchdog、sh等)打上“System Service”标签。 在组件列表中,单击组件所在行“操作”列下的
搜索任务 支持按任务名称、创建人、更新人、最近执行结果、任务类型和企业项目搜索。在右上角的搜索框中输入关键字,单击后在下面任务列表显示匹配对象。 隐藏/显示任务列表的列信息 单击,根据需要勾选/取消勾选对应列,可在任务列表中显示/隐藏该列。 刷新任务列表 单击,可刷新任务列表。 父主题:
云服务授权 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM 2.0服务生效。 前提条件
in、kube-dns、org.tanukisoftware.wrapper.WrapperSimpleApp、evs-driver, obs-driver、sfs-driver, icwatchdog、sh等)打上“System Service”标签,您可单击右上角的,通过选中
u_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。 表达式设置为“a/b”,最终计算结果即为主机的CPU内核占用率。
自建Prometheus数据上报到AOM 在default、ECS、CCE、通用实例类型的Prometheus实例的“设置”页签,可以获取当前Prometheus实例的Remote Write地址。将原生Prometheus的指标通过Remote Write上报到AOM服务端,即可实现时序数据的长期存储。
云服务授权 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。 前提条件 AOM
全局开关 “指标采集开关”用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。“告警消息内容显示资源的TMS标签”开关用来控制告警通知的消息内容是否显示不同云资源的标签。该权限设置针对整个AOM 2.0服务生效。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。
assandra、ClickHouse、DBCP、Druid、EsRestClient、GaussDb、Hikari连接池、Jetcd、ObsClient、MySQL、Postgresql、Oracle、HBase、NodeJsMysql 以及MongoDB多种类型。对于数据库的
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。