检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Prometheus实例中。 当前仅ECS类型Prometheus实例支持。 云服务接入 AOM支持在Prometheus实例的“云服务接入”中将云服务接入AOM,将云服务关指标上报到定的云服务Prometheus实例中。 当前仅云服务类型Prometheus实例支持。 账号接入 AOM支持在Pr
提供应用、主机等资源的检索功能,支持通过ID、关键字、名称等方式快速检索资源。 不支持 支持 应用管理 管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+ 组件 + 环境”的应用管理模型。 资源管理 全局查看所有的云服务资源对象与应用的关联关系,便于用户对资源进行分析和管理。 环境标签 为已创建的
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
监控对象最多可添加100条指标数据。 选择监控对象时,如果开启了应用到所有开关,将会针对应用或服务下的所有该类型指标创建一条告警规则。例如选择了“CCE / 主机 / 主机 / CPU使用率”指标,开启应用到所有开关,则会为CCE服务下所有主机创建一条告警规则。 单击“修改资源对象”可修改已选择的资源对象。
通过阈值规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 AOM已对接消息通知服务(Simple Message Notification,简称SMN),通过在SMN界面设置通知策略,当阈值规则的状态(正常、超限阈值、数
资源监控使用说明 满足内置发现规则的服务,安装ICAgent后该服务会自动被发现;对于不满足内置应用发现规则的服务,您则需配置应用发现规则。 资源监控使用说明如下: 图1 资源监控使用说明 父主题: 资源监控
管理AOM告警规则 告警规则创建完成后,可在“规则列表”中查看告警规则的规则名称、类型、状态、监控对象等信息,并可根据需要修改、启动或停止告警规则。 管理指标或事件告警规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警规则”,默认显示“指标或事件”页签。 在
据源查询。本节介绍如何使用自建Prometheus,通过Remote read接口读取AOM Prometheus实例的数据。 前提条件 服务已接入可观测Prometheus 监控。具体操作请参见:管理Prometheus实例。 配置Remote Read地址 推荐配置自建Prometheus的prometheus
通过AOM查看事件巡检数据 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小
如果已知资源使用情况,需了解价格预算和计费方式选择,可前往价格计算器预算价格。 计费模式 AOM当前提供按需计费模式,按需计费是一种后付费模式,即先使用再付费,按照云服务器实际使用时长计费。关于按需计费模式的详细介绍请参见计费模式概述。 计费项 AOM的计费项由自定义指标上报量、指标存储时长、数据转储量的费
时间的描述格式由rfc822定义。 Mon,12 Nov 2007 15:55:01 GMT Server HTTP协议标准报头。包含了服务器用来处理请求的软件信息。 Apache Content-Length HTTP协议标准报头。用于指明实体正文的长度,以字节方式存储的十进制数字来表示。
实例数据 将云服务或CCE集群接入Prometheus实例后,即可通过Grafana查看AOM中相关集群或云服务的指标数据。 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。 服务已接入可观测Prometheus
拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 AOM提供了告警通知功能,您可通过创建通知规则进行详细配置,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,可利用此功能将告警信息通过邮件或短信发送给您指定的人员,以便提醒相关人员及时采取措施清除故障,避免造成业务损失。
单击事件卡片或列表进入该事件详情页面,查看各类型事件的根因分析。 应用服务整体平均响应时间突增:基于应用的调用链数据,针对应用粒度提供下钻分析,分析应用下每个组件的平均时延以快速定位根因,找到导致应用整体RT突增的具体组件。 图1 应用服务整体平均响应时间突增 应用服务整体错误率突增:基于应用的调用链数据,针
尾。 设置日志存储时间。存储时间默认为7天,可设置为1~30天内的时间节点。超出存储时间的日志将会被自动删除,您可以按需将日志数据转储至OBS桶中长期存储。 单击“确定”完成创建。 创建日志流 输入日志流名称。日志流名称只支持输入英文、数字、中文、中划线、下划线及小数点,且不能以小数点、下划线开头或以小数点结尾。
401 Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 403 Forbidden 请求被拒绝访问。 返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。
查看场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 运维配置
管理日志接入 AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中“接入管理”功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 约束与限制 需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“接入管理”功能。
通过拓扑图查看组件间调用关系 拓扑图展示服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图可以自动梳理组件之间的调用关系,帮助用户快速定位问题。 通过拓扑图查看组件查看间调用关系 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。