检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用资源管理 应用资源管理概述 首页介绍 应用管理 资源管理 环境标签 父主题: 应用洞察
需在华为云官网登录就可在自建系统界面查看AOM仪表盘图表页面。 通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。
计算表达式。Prometheus监控将通过该表达式计算得出预聚合指标。计算表达式必须符合PromQL。 labels 指标的标签。标签必须符合Prometheus指标标签规范。(可选) 配置后的Recording Rule示例如下: groups: - name: apiserver_request_total
告警规则(新版) 概述 标签和标注 创建阈值规则 创建静态阈值模板 创建事件类告警规则 父主题: 告警管理
在“正文”区域右上角,单击“添加变量”可添加需要的变量信息。 当在消息模板中添加“TMS标签: $event.annotations.tms_tags;”变量时,需要在配置告警消息内容显示资源的TMS标签开关配置中打开“告警消息内容显示资源的TMS标签开关”开关后,该变量才会生效。 选择“邮件”方式发送通知时
创建环境(供其他服务调用) environment createAomEnv 创建环境标签 tag createTag 更新标签 tag updateTag 删除环境标签 tag deleteTag 更新环境标签 tag updateEnvTag 新增多云账户 cloud_account addCloudAccount
创建AOM指标告警规则 创建AOM事件告警规则 创建AOM应用性能监控告警规则 创建AOM日志告警规则 批量创建AOM云服务告警规则 管理AOM告警规则 标签和标注 普罗语句说明 父主题: 告警监控
输入过滤属性和对应的过滤值,指定过滤条件来选择实例。 支持设置多个过滤条件,搜索时多个过滤属性之间为“与”的关系。 该方式对未来新增实例也生效。 标签 设置标签键和对应的标签值,指定一个或多个标签来选取实例。 选择多个标签时,按照“与”的关系搜索。 该方式对未来新增实例也生效。 从CMDB中选择 输入搜索条
现去重的效果,用户无需手动创建规则。 分组、抑制、静默需手动创建规则,具体的创建方式请参见创建分组规则、创建抑制规则和创建静默规则。 约束与限制 此模块只作用于消息通知部分,所有触发的告警和事件都可在“告警列表”页面查看。 告警降噪中所有的规则条件均取自告警结构体中的"metad
系统处理方式包括:告警、数据不足并发送事件、保持上一个状态、正常。 图1 设置告警条件 根据需要设置告警标签和告警标注信息,为告警匹配分组,后续可关联告警降噪策略来发送告警通知。详细说明请参见标签和标注。 单击“添加自定义标签”或“添加自定义标注”可添加多条信息。 设置告警通知策略。告警通知策略有两种方式,请根据需要选择:
100 上报内存指标增加内存workingset使用量、内存workingset使用率 容器采集支持通过标签区分stderr.log和stdout.log 容器上报增加Pod_ip的tag **配置匹配当前目录文件 5.12.98 增加LTS日志黑名单功能,更改容器指标来源为working_set
外部调用 在“实例名称”和“监控项”下拉列表中选择实例与监控项,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围,您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围。 在过滤器上方的下拉列表中选择需要查看的应用。 单击事件卡片或列表进入该事件详情页面,查看事件的故障传播链。
与AOM 1.0对比 AOM 2.0基于AOM 1.0原有功能,结合用户常用的应用监控,增加了多种指标和日志数据的采集与监控,并对监控结果可视化呈现。同时,通过自动化运维功能将日常运维操作服务化、自动化,减少运维人员重复性操作。 本章节主要对比AOM 2.0与AOM 1.0版本的功能特性。
设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。 单击列表右上的,可以导出当前页的列表信息,最大支持导出100条。
CONSOLE SERVICE_DISCOVERY 表4 TagNameAndIdVo 参数 参数类型 描述 tag_id String 标签Id tag_name String 标签名称 状态码: 400 表5 响应Body参数 参数 参数类型 描述 error_code String
Prometheus监控的Recording Rule能力。可以通过PromQL将原始数据加工成新的指标,提升查询效率。 时间序列 由指标名和标签组成。属于同一指标和同一组标签维度的带时间戳的流。 远程存储 自研的时序数据存储组件。支持Prometheus监控的Remote Write协议,由云产品全面托管。
"resource_id" : "ecs123" , "key1" : "value1" // 创建告警规则时配置的告警标签 }, "annotations" : { "alarm_probableCause_zh_cn" : "可能原因"
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警” 告警标签 单击添加告警标签。告警标签为告警标识性属性,key:value键值对格式,主要应用于告警降噪等场景。本示例可不填写。 - 告警标注 单击添加告警标注。