检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为指标设置统计周期和检测规则等信息。 表3 告警规则详情填写说明 参数名称 参数说明 示例 多指标 按设置的多个指标数据和对应告警条件逐条计算,只要满足一个条件则触发告警。 多指标 指标 需要监控的指标。单击“指标”文本框,通过下拉框右侧的资源树,可以按资源类型快速选择需监控的指标。
在Prometheus实例列表中,单击多账号聚合类型的Prometheus实例名称,进入该实例的“账号接入”界面。 在“账号接入”界面可以管理成员账号、接入云服务、选择数据存储,并添加云服务支持的相关指标。 管理成员账号:AOM为企业用户提供多账号关系的管理能力,支持用户将多个华为云账号整合到创建的组织中,并可以
管理的基本单位,可以创建日志流以及设置日志存储时间,每个账号下可以创建100个日志组。创建日志组详细操作参见日志组。 日志流 选择日志流。日志流(LogStream)是日志读写的基本单位,日志组中可以创建日志流,将不同类型的日志分类存储,方便对日志进一步分类管理。创建日志流详细操作参见日志流。
AOM提供了海量运行日志的检索和分析功能,支持日志采集、下载、转储、搜索,并提供报表分析、SQL查询、实时监控、关键词告警等能力。 AOM的基础版和按需版所对应的日志存储时长、大小和计费方式不同,详见收费详情。 日志流量 日志流量指的是每秒上报的日志大小。每个租户在每个Region的日志流量不能超过10MB
使用Prometheus监控CCE集群指标 AOM基于Prometheus监控生态,提供了托管式的CCE类型Prometheus实例 ,适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。CCE Prometheus实例默认提供对容器服务CCE集群的Prometheus云
升级ICAgent 为了更好的采集体验,AOM会不断更新ICAgent版本。当系统提示您有新的ICAgent版本时,您可以按照如下操作步骤进行升级。 如果ICAgent存在严重的bug时,系统会对采集的版本进行升级。 在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右
删除一个或多个指标:选中一个或多个指标前的复选框,单击页面上方的“删除”。 导出监控报告 单击“导出报告”,可将该指标图表以CSV格式导出,以便进行本地存储及进一步分析。 表3 相关操作 操作 说明 添加指标图表到仪表盘 选择指标后,单击“添加到仪表盘”,可将该指标图表添加到仪表盘中。 为指标添加阈值规则
监控概览 “监控概览”界面提供了资源、应用、应用用户体验的全链路、多层次、一站式运维界面。分别展示了基础设施监控、应用监控、告警统计、主机监控(CPU&内存)、组件监控(CPU&内存)、容器实例监控(CPU&内存)、主机监控(磁盘)、主机监控(网络)、集群监控(CPU&内存)和集
r =="string"。 布尔常量:支持布尔常量(true、false)。示例:(x < 100)!=true。 括号:支持使用括号改变计算的优先级。示例:x *(y + 10)<200。 contains函数:支持使用contains函数判断是否包含子串,例如contains(str
tion_seconds_bucket 存储操作耗时bucket storage_operation_duration_seconds_count 存储操作耗时count storage_operation_errors_total 存储操作错误次数 volume_manager_total_volumes
当前仅default类型、CCE类型、云服务类型、ECS类型、通用实例类型的Prometheus实例支持。 存储时长 AOM支持在Prometheus实例的“存储时长”中配置Prometheus实例的指标存储时长。 当前仅云服务、ECS、CCE、 多账号聚合实例、APM、通用实例与default类型支持。
日志配置”,在“配置中心 > 采集开关”页签,将“日志采集开关”置于“开启”状态。 日志的计费依据为日志使用量,包括日志读写、日志索引和日志存储。超过免费额度后,将无法再进行日志读写和索引,同时也不再产生日志读写和索引费用。此时需要打开“超额继续采集日志”开关。方法如下: 登录AOM控制台,在左侧导航栏中选择“配置管理
Prometheus的指标通过remote write上报到AOM服务端,参见将Prometheus的数据上报到AOM,实现时序数据的长期存储;也可以通过access_code作为认证凭据来查询AOM中的数据,参见通过grafana查看AOM中的指标数据,AOM支持以下原生Prometheus的API:
使用流程 应用运维管理(Application Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。
ECS类型Prometheus实例的指标数据不支持展示资源类型。 指标量(最近10分钟) 最近十分钟新存储的指标量。 云服务类型Prometheus实例的指标数据不支持展示最近十分钟新存储的指标量。 占比 该指标数量在所有指标中的占比。 云服务类型Prometheus实例的指标数据不支持展示指标占比。
中间件及自定义插件接入AOM总览 AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持快捷安装Prometheus官方中间件Exporter,及自定义插件。通过为中间件及自定义插件创建采集任务,并执行插件脚本,AOM就可以对相应的中间件及自定义插件指标进行监控,结合开源G
1个组件状态图表最多可添加10个组件。 指标 指标数据存储时长 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 通过ICAgent插件采集指标数据时,采集周期为1分钟,不支持修改。 关联指标项存储时长 资源(例如,集群、组件、主机等)被删除后,
- 版本号 软件的版本信息,请按照实际输入。 - 企业项目 选择所属的企业项目。 - 超时时长 文件包安装/卸载任务超时时长。 - 目标存储路径 输入文件包分发到ECS实例上的实际存放路径。 - 描述 文件包的描述信息,最多可输入128个字符。 文件来源 OBS区域 OBS桶所在的区域,请从下拉列表中选择。
AOM会产生阈值告警。 日志管理 AOM提供强大的日志管理能力。日志检索功能可帮您快速在海量日志中查询到所需的日志;日志转储帮您实现长期存储;通过创建日志统计规则实现关键词周期性统计,并生成指标数据,实时了解系统性能及业务等信息;通过配置分词可将日志内容按照分词符切分为多个单词
headers: [ <string>: <string> ... ] # prometheus remote read时,是否直接从本地存储读取指标 [ read_recent: <boolean> | default = false ] # 为每个 remote read