检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
放到Kafka队列中,利用Kafka高吞吐的能力,实时将数据传输给业务计算层。 数据存储:运维数据经过AOM后端服务的处理,将数据写入到数据库中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。
创建静态阈值模板 使用模板创建阈值规则前需要先创建一个静态阈值模板。 注意事项 您最多可创建50个静态阈值模板,如果静态阈值模板数量已达上限50个时,请删除不需要的静态阈值模板后重新创建。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警 > 告警规则”。 在“静态阈值模板”页签下,单击“创建静态阈值模板”。
指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 指标总量 单租户总指标量不超过40W 小规格总指标量不超过10W 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 维度 每个指标的维度最多为20个。
阈值告警最佳实践(旧版) 该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。
域,默认云服务器与AOM服务端网络互通。 本Region外:云服务器所在区域与当前AOM服务端不在同一区域,需要根据场景选择合适的网络联通方案。 本Region内 服务器类型 选择云服务器类型支持以下两种: ECS云服务器:ECS云服务器管理下的主机。 其他服务器:其他服务器管理下的主机。
域,默认云服务器与AOM服务端网络互通。 本Region外:云服务器所在区域与当前AOM服务端不在同一区域,需要根据场景选择合适的网络联通方案。 本Region内 服务器类型 选择云服务器类型支持以下两种: ECS云服务器:ECS云服务器管理下的主机。 其他服务器:其他服务器管理下的主机。
指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 指标总量 单租户总指标量不超过40W 小规格总指标量不超过10W 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 维度 每个指标的维度最多为20个。
在左侧导航栏选择“日志设置”,单击“分词配置”页签。 登录LTS控制台。 在左侧导航栏选择“配置中心”。 单击“分词配置”页签。 分词配置 ICAgent采集 为了减少内存、数据库和磁盘空间占用,您可以按需进行ICAgent采集设置。 登录AOM 2.0控制台。 在左侧导航栏选择“设置”,进入全局配置界面。 在左侧导
监控概览 “监控概览”界面提供了资源、应用、应用用户体验的全链路、多层次、一站式运维界面。分别展示了基础设施监控、应用监控、告警统计、主机监控(CPU&内存)、组件监控(CPU&内存)、容器实例监控(CPU&内存)、主机监控(磁盘)、主机监控(网络)、集群监控(CPU&内存)和集
Prometheus实例 for ECS ECS 通过在VPC内的某台虚机上安装uniagent(Exporter)插件提供针对此VPC内ECS应用和组件(如数据库,中间件等)的一体化监控。 适合需要对运行在华为云的虚拟私有云VPC内(通常为弹性云服务器ECS集群)的应用组件进行监控场景,可以通过接入
数据保护技术 AOM通过多种数据保护手段和特性,保障AOM的数据安全可靠。 表1 AOM的数据保护手段和特性 数据保护手段 简要说明 详细介绍 传输加密(HTTPS) AOM支持HTTPS传输协议,保证数据传输的安全性。 构造请求 数据冗余存储 指标、告警、配置等数据以多副本方式存储,保障数据可靠性。
数据保护技术 AOM通过多种数据保护手段和特性,保障AOM的数据安全可靠。 表1 AOM的数据保护手段和特性 数据保护手段 简要说明 详细介绍 传输加密(HTTPS) AOM支持HTTPS传输协议,保证数据传输的安全性。 构造请求 数据冗余存储 指标、告警、配置等数据以多副本方式存储,保障数据可靠性。
添加监控数据 功能介绍 该接口用于向服务端添加一条或多条监控数据。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ams/report/metricdata 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
database # 启用数据库指标采集 - --collect.collection # 启用集合指标采集 - --collect.topmetrics # 启用数据库表头指标信息采集
获取应用接口发生调用时产生的调用链数据,然后根据应用近7天的调用链数据来训练调用链模型。默认每14天后台自动更新模型,并将模型保存在后台数据库中。 在线推理阶段:当用户单击事件卡片,进入到根因分析页面时,会触发根因分析模型的在线推理任务,在线推理任务会基于上一步离线训练完的调用链
管理AOM告警规则 告警规则创建完成后,可在“规则列表”中查看告警规则的规则名称、类型、状态、监控对象等信息,并可根据需要修改、启动或停止告警规则。 管理指标或事件告警规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警规则”,默认显示“指标或事件”页签。 在
接到AOM的 Prometheus实例中。 图1 第三方云厂商或IDC自建Prometheus对接到AOM Prometheus实例 解决方案 您需要先配置VPC-EP;如果您在华为云拥有弹性云服务器ECS,您可以根据需要通过步骤二和步骤三验证网络的连通性;最后通过专线访问AOM
查看AOM告警或事件 “告警列表”页面提供告警和事件的查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能: 告警列表:支持按告警级别图形化查看告警信息。 高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。
本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 应用场景 某电商平台运维人员在监控指标时,只能实时监控一个账号下的指标数据,无法同时监控其他账号。 解决方案 AOM通过Prometheus监控功能,创建多账号聚合实例,并接入账号、云服务与云服务相关指标,支持在“指标浏览”界面同时监控多个成员账
服务场景的具体操作,参见服务场景。 图6 配置服务场景 配置作业管理任务。 任务类型选择“作业管理”。 在下拉列表中,分别选择作业名和执行方案。 图7 配置作业管理 如需设置审批配置、执行策略,可展开“更多设置”进行配置,配置参数如表5。 表5 更多设置 参数类别 参数名称 说明