检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配额设置 指标配额可通过切换基础版(受限免费)和按需版(按需计费)来修改。 登录AOM控制台。 选择“配置管理 > 配额设置”。 查看指标配额。 图1 查看配额 当指标超过配额时,时间较早的指标将会被删除。 父主题: 配置管理
Management,简称AOM)是云上应用的一站式立体化运维管理平台,提供一站式可观测性分析和自动化运维方案,支持快速从云端、本地采集指标、日志和性能数据,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。 您可以使用本文档提供的API对应用运维管理服
单击任务列表右上角的按钮,可刷新列表信息。 查看任务信息 单击任务ID,可以查看该任务的具体信息,包括主机名、IP名、插件类型、任务类型、执行状态、执行失败的原因、执行事件、执行耗时和查看操作日志。 过滤任务信息 在任务列表的表头,单击各列的,可按特定类型过滤显示任务的信息。 切换任务排序
云服务”和“Prometheus for 多账号聚合”的实例上报的基础指标和自定义指标数量。 指标上报量统计周期为1小时,如果设置的查询时间范围小于1小时,可能会导致指标累计上报量查询结果为0。 “资源消耗”页面展示的指标上报量可能与实际指标上报量存在一定误差。 查看Prometheus实例指标上报量 登录AOM
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
停止计费 对于以按需计费模式使用的AOM 2.0资源,相关指标和日志数据从上报之日起,在AOM 2.0上会自动存储一个月,一个月后系统自动删除数据,删除后相关数据将停止计费。如果用户需要继续使用相关指标和日志数据,建议采用以下方式存储: 日志数据:通过日志转储功能,将日志数据转储
告警模板是一组以云服务为单位的告警规则组合,通过告警模板用户可对同一个云服务下的多个指标批量创建阈值告警规则、事件告警规则和PromQL告警规则。 约束与限制 系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。
个矩形块表示的时间为已选择的时间范围/30,例如,时间范围选择近30分钟,则每个矩形块表示的时间为1分钟,若时间范围选择近60分钟,则每个矩形块表示的时间为2分钟,纵轴显示查询到的日志条数。 图1 通过柱状图查看统计数据 将鼠标移至矩形块,提示信息显示了该矩形块代表的时间范围(起
警管理系统根据标签属性进行告警管理和通知。 告警标签为key:value键值对格式,支持用户自定义。key 和value只能由字母、数字和下划线组成,且不能以下划线开头,您最多可创建10个自定义标签。 如果在创建告警规则时设置了告警标签,触发的告警会自动添加该标签为告警属性。 消息模板中通过$event
单击“创建”,或在告警规则列表中选择待修改的某条告警规则,单击“操作”列的。 在告警规则的创建或修改页面,单击“高级设置”。 在“告警标签”或“告警标注”属性下,单击,输入标签键和标签值。 输入完成,单击“确定”,即可完成一个告警标签或告警标注的添加。 添加多个告警标签或告警标注:多
产品规格差异 应用运维管理服务(简称AOM)按计费方式不同分为基础版、按需版两种,其中按需版又分为专业版和企业版。 各版本的具体规格差异请参见表1。 表1 版本规格差异说明 规格项 基础版 专业版 企业版 日志读写流量 500MB 400GB 1TB 日志索引流量 500MB 400GB
SQL分析语句,AOM会根据设置的语句对日志流中的日志进行监控。 校验规则 输入具体的条件表达式,当条件表达式返回为true的时候,产生告警,否则不产生告警。 触发告警级别包括“紧急”、“重要”、“次要”、“提示”,默认“紧急”。 统计周期指高级设置的统计周期;满足条件指设置的条件表达式。配置的统计周期
PAAS_APP_NAME:应用名称,即要部署的工作负载名称。 PAAS_NAMESPACE:命名空间名称,即要部署的工作负载所在CCE集群的的命名空间。可进入CCE集的详情页的“命名空间”页面进行查询。 PAAS_PROJECT_ID:租户的项目ID。获取方法详情请参见:获取项目ID。 以上env相关参数的value请根据实际情况替换。
在左侧导航栏中选择“资源分组”,可查看资源分组的信息。 也可在右侧的搜索框中,输入“资源名称”,可搜索资源分组。 编辑资源分组 在左侧导航栏中选择“资源分组”,可查看资源分组的信息。 在资源分组名称后的操作列,单击“修改”。 在弹出的窗口,修改资源信息后,单击“确定”,修改资源信息。
采集周期(秒):采集数据的周期,单位为秒(s),默认为60s,可选择10s、30s和60s。 超时时间(秒):执行采集任务的超时时间,单位为秒(s),默认为60s,可选择10s、30s和60s。超时时间必须小于等于采集周期。 执行用户:执行采集任务的用户,即所选主机的用户,默认为root,并且当前只支持root账号采集。
查询指标 功能介绍 该接口用于查询系统当前可监控的指标列表,可以指定指标命名空间、指标名称、维度、所属资源的编号(格式为:resType_resId),分页查询的起始位置和返回的最大记录条数。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ams/metrics
管理主机的UniAgent UniAgent安装成功后,支持对主机的UniAgent进行重装、升级、卸载和删除操作。 约束与限制 如果通过旧版方式安装UniAgent的主机是Windows操作系统,需在主机上手动执行重装UniAgent操作。 UniAgent暂时不提供自动升级,而是根据您的需求自主进行升级。
Prometheus实例的名称,进入实例的详情页面。 在左侧导航栏中单击“仪表盘”,即可查看当前Prometheus实例下系统预置的所有仪表盘模板。 根据需要,单击对应仪表盘模板名称,即可监控当前Prometheus实例的指标数据。 例如,需要监控主机的磁盘分区信息,则单击“di
odMonitor的方式暴露采集目标。 预聚合 Prometheus监控的Recording Rule能力。可以通过PromQL将原始数据加工成新的指标,提升查询效率。 时间序列 由指标名和标签组成。属于同一指标和同一组标签维度的带时间戳的流。 远程存储 自研的时序数据存储组件。