检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
或“其他:用户自定义接入主机”。 升级ICAgent。如果在步骤2中下拉列表框中选择的是“集群:xxx”,则单击“升级ICAgent”。可实现整个集群的升级操作,即在ICAgent列表下的所有主机一次性完成升级。如果在步骤2中下拉列表框中选择的是“其他:用户自定义接入主机”,则先选择主机后单击“升级ICAgent”。
None 操作指导 应用运维管理 AOM 如何创建告警规则 04:10 创建告警规则
告警管理 如何区分告警和事件?
其他常见问题 AOM 1.0与AOM 2.0使用对比 AOM与APM有何区别? AOM的日志服务与LTS的日志服务有何区别? 如何创建委托apm_admin_trust?
或“其他:用户自定义接入主机”。 升级ICAgent。如果在步骤2中下拉列表框中选择的是“集群:xxx”,则单击“升级ICAgent”。可实现整个集群的升级操作,即在ICAgent列表下的所有主机一次性完成升级。如果在步骤2中下拉列表框中选择的是“其他:用户自定义接入主机”,则先选择主机后单击“升级ICAgent”。
理完成后再发送通知,避免产生告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 图1 告警降噪流程图 分组、抑制、静默需手动创建规则,创建方式见下方文档说明。 此模块只作用于消息通知
prometheus监控 GET方法查询区间数据 (推荐)POST方法查询区间数据 GET方法查询瞬时数据 (推荐)POST方法查询瞬时数据 查询标签值 GET方法获取标签名列表 (推荐)POST方法获取标签名列表 元数据查询 父主题: API
当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
Rule能力。可以通过PromQL将原始数据加工成新的指标,提升查询效率。 时间序列 由指标名和标签组成。属于同一指标和同一组标签维度的带时间戳的流。 远程存储 自研的时序数据存储组件。支持Prometheus监控的Remote Write协议,由云产品全面托管。 云产品监控 无缝集成了多种云产品的监控数据。用户
安装文件包提示没有OBS权限怎么办? 定时任务无法成功触发 编排好的作业,能否在执行时再选择执行机,填入脚本参数等内容? 使用cron表达式创建定时任务,提示参数错误 如何为执行方案配置审批? 执行清理磁盘任务时,提示 delete success:{},未成功删除已选择目录下的文件 编辑作业后,作业的执行方案未更新
配置预聚合规则 指标管理 仪表盘监控 数据多写 配置指标存储时长 接入指南 获取Prometheus实例的服务地址 Prometheus实例读写地址支持公网的局点 通过Remote Read方式读取Prometheus实例数据 自建Prometheus数据上报到AOM 通过Grafana查看Prometheus实例数据
在下拉菜单中选择企业项目,仅开通企业版才会显示。 描述 应用的描述信息,最多可输入1000个字符。 接入方式默认选择“增强型探针”。 数据接入方式选择“无侵入接入”,通过接入命令接入。 图4 数据接入 表5 环境参数说明 环境变量 入参 描述 选项 APM_APP_NAME appName 组件名称,代表
AOM不重复计费。AOM界面集成了LTS,可通过AOM界面统一运维;LTS也有独立的控制台入口,可以单独使用LTS。如需停止计费请参见:如何停止日志功能,不再收费? 父主题: 其他常见问题
IAM项目(Project) 企业项目(Enterprise Project) 区间数据查询 GET /v1/{project_id}/aom/api/v1/query_range aom:metric:list √ √ 区间数据查询 POST /v1/{project_id}/aom/api/v1/query_range
监控 查询时间序列 查询时序数据 查询指标 查询监控数据 添加监控数据 添加或修改服务发现规则 删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
Thin pool 元数据空间使用率 (aom_host_diskpartition_thinpool_metadata_percent) 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) Thin pool 数据空间使用率 (aom_h
接入管理 概述 将Prometheus的数据上报到AOM 通过grafana查看AOM中的指标数据 父主题: 配置管理
告警。默认只监控一个周期,最多可监控5个周期指标数据。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要启动或者关闭。 默认只监控一个周期,最多可监控5个周期指标数据。 系统处理方式包括:告警、数据不足并发送事件、保持上一个状态、正常。 图1 设置告警条件
String 状态 表4 rule字段数据结构说明 参数名称 参数类型 描述 name string 策略名称 conditions 参见表5 匹配条件具体内容。 actions 参见表6 指定策略匹配成功后执行的动作。 表5 conditions字段数据结构说明 参数名称 参数类型 描述