检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
异常类型 数量 该异常的发生次数 异常消息 该异常产生的异常消息 异常堆栈 该异常产生的堆栈信息 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 单击列表中“调用次数”、“平均响应时间(ms
如何将Prometheus数据接入到AOM? 将Prometheus数据接入到AOM。具体的操作步骤如下: 创建Prometheus实例。 根据需要参考对应的创建操作,具体请参见:管理Prometheus实例。 将原生Prometheus的指标通过Remote Write地址上报到AOM服务端。具体请参见:将
网络指标及其维度 磁盘指标及其维度 磁盘分区指标 文件系统指标及其维度 主机指标及其维度 集群指标及其维度 容器组件指标及其维度 虚机组件指标及其维度 实例指标及其维度 服务指标及其维度
如何将Prometheus数据接入到AOM? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? 如何获取Prometheus实例的服务地址? 不能废弃以aom_prom_fixed作为前缀的指标
图4 AOM优势2 海量日志管理 高性能搜索和业务分析,自动将关联的日志聚类,可按应用、主机、文件名称、实例等维度快速过滤。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角分析关联指标和告警数据,直击异常。 生态开放 开放了运营、运维数据查询接口和采集标准,支持自主开发。
查看场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 运维配置
”。 步骤二:将云服务接入Prometheus实例中 登录AOM 2.0控制台。 在左侧导航栏中选择“Prometheus监控 > 实例列表”。 单击“创建Prometheus实例”,设置实例名称、企业项目和实例类型信息。 “实例类型”选择“Prometheus for 云服务”。
息,您可以快速响应,保证应用流畅运行。 应用监控是逐层下钻设计,层次关系为:应用列表->应用详情->组件详情->实例详情->进程详情。即在应用监控中,将应用、组件、实例、进程做了层层关联,在界面上就可以直接得知各层关系。 主机监控 主机监控是针对主机的监控,通过主机监控您可以及时
径进行日志采集。 采集Windows事件日志:当选择Window主机采集日志时,需要开启“采集Windows事件日志”,并且可以设置“日志类型”、“首次采集时间偏移量”、“事件等级”来过滤采集您所需要的日志内容。 日志格式:选择采集的日志文件是单行显示还是多行显示。 日志时间:当
Boolean 是否发布成服务 job_id String 作业id 最小长度:1 最大长度:64 job_version Integer 作业版本 最小值:1 最大值:999 name String 模板名称 最小长度:1 最大长度:64 need_synchronize Boolean
指标、告警、配置等数据以多副本方式存储,保障数据可靠性。 / 数据订阅 AOM支持客户配置数据订阅,把客户的指标和告警数据发送到客户指定的DMS实例中,客户可以自由处理转储出来的这部分数据。 数据订阅 父主题: 安全
Enterprise-Project-Id 否 String 企业项目id。 获取方式请参见:获取企业项目ID 删除单个企业项目下实例,填写企业项目id。 不填时,默认删除企业项目id为0下的实例。 表3 请求Body参数 参数 是否必选 参数类型 描述 alarm_rule_templates 是 Array
入门实践 当您完成了安装ICAgent、配置服务发现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华
parameters 是 参见表7 - 包含扩缩容的实例数。 表7 parameters字段数据结构说明 参数名称 是否必选 参数类型 取值范围 描述 scale_unit 是 Integer 在策略组的最小实例数与最大实例数之间 扩缩容的实例数 请求示例 修改告警策略示例 {
Enterprise-Project-Id 否 String 企业项目id。获取方式请参见:获取企业项目ID。 查询单个企业项目下实例,填写企业项目id。 查询所有企业项目下实例,填写“all_granted_eps”。 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述
流为单位发往AOM,您可以在AOM控制台实时查看日志。 Prometheus监控 提供实例列表、资源消耗功能。 实例列表 Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,可灵活扩展云原生组件指标插件。 资源消耗
应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。应用的类型包括系统应用和自定义应用,通过内置发现规则发现的是系统应用,通过自定义规则发现的是自定义应用。应用列表展示了每个应用的名称、运行状态、部署方式等信息。AOM支持从应用下钻到组件,再从组件下钻到实例,从实例下钻到进程。通过各层状态,您可完成对
支持数据写入kafka。 聚合查询 不支持聚合查询,仅支持简单查询。 支持多实例聚合查询,例如:按标签、按资源组等聚合。 PromQL语法 不支持 支持,告警规则、仪表盘、指标浏览等监控功能均支持。 仪表盘 支持标准云产品的单实例大盘。 提供丰富的预置模板。 仪表盘支持的图表类型 2 8+ 仪表盘支持的监控视图数
参数类型 取值范围 描述 scale_unit 是 Integer 在策略组的最小实例数与最大实例数之间 扩缩容的实例数 请求示例 定时策略示例 { "name" : "policy1", "policy_type" : "SCHEDULED", "rule" :
AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾