检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Exporter告警接入等操作。 约束与限制 为了方便安装管理Exporter,推荐使用云容器引擎 CCE进行统一管理。 前提条件 CCE服务已拥有CCE集群并已安装Kafka。 服务已接入可观测Prometheus监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 已将对应k
通过AOM查看事件巡检数据 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小
服务指标及其维度 服务指标是由实例指标汇聚而来的,其指标维度与实例指标维度相同。 实例指标详见:实例指标及其维度。 父主题: 指标总览
单击事件卡片或列表进入该事件详情页面,查看各类型事件的根因分析。 应用服务整体平均响应时间突增:基于应用的调用链数据,针对应用粒度提供下钻分析,分析应用下每个组件的平均时延以快速定位根因,找到导致应用整体RT突增的具体组件。 图1 应用服务整体平均响应时间突增 应用服务整体错误率突增:基于应用的调用链数据,针
使用1中的账号,登录华为云官网,在顶部导航栏右侧单击“控制台”,进入华为云控制台。 在左侧导航栏上方,单击,选择服务实例所在的区域项目。 单击,在查找框中搜索“应用运维管理 AOM”,单击查找到的结果,进入AOM服务控制台。 在左侧导航栏中,选择“仪表盘 > 可观测大屏”。 在可观测大屏页面,单击“免费试用”。
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。
权限隔离。 将AOM资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用AOM服务的其它功能。 本章节为您介绍对用户授权的方法,操作流程如图1所示。
获取项目ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 从IAM服务获取的用户Token。获取方式请参见:获取Token。 Content-Type 是 String 消息体的类型(格式)。指定类型为“application/json”。
权限隔离。 将AOM资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用AOM服务的其它功能。 本章节为您介绍对用户授权的方法,操作流程如图1所示。
查看组件外部调用监控项 外部调用是对当前应用调用的外部服务进行监控,包括CSEConsumer集群监控、ApacheHttpClient连接池、ApacheHttpAsyncClient连接池、DubboConsumer监控、HttpClient监控、NodeJsHttpClie
Exporter告警接入等操作。 约束与限制 为了方便安装管理Exporter,推荐使用云容器引擎 CCE进行统一管理。 前提条件 CCE服务已拥有CCE集群,已安装ElasticSearch。 服务已接入可观测Prometheus监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 已
获取项目ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 从IAM服务获取的用户Token。获取方式请参见:获取Token。 Content-Type 是 String 消息体的类型(格式)。指定类型为“application/json”。
基础指标:IEF指标 介绍IEF服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标
创建云监控告警规则 云监控服务支持灵活的创建告警规则。您既可以根据实际需要对某个特定的监控指标设置自定义告警规则,同时也支持使用告警模板为多个资源或者云服务批量创建告警规则。 告警模板 告警模板是一组以云服务为单位的告警规则组合,通过告警模板用户可对同一个云服务下的多个指标批量创建阈
离。 将自动化运维资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用自动化运维服务的其它功能。 本章节为您介绍对用户授权的方法,操作流程如图1所示。
据源查询。本节介绍如何使用自建Prometheus,通过Remote read接口读取AOM Prometheus实例的数据。 前提条件 服务已接入可观测Prometheus 监控。具体操作请参见:管理Prometheus实例。 配置Remote Read地址 推荐配置自建Prometheus的prometheus
消息通知模板名称。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 从IAM服务获取的用户Token。获取方式请参见:获取Token。 Content-Type 是 String 消息体的类型(格式)。指定类型为“application/json”。
事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。 事件根因分析:提供基于应用性能管理APM平台的调用链追踪根因定位技术。可以从应用服务和流量Top N接口的指标、调用链维度,全局分析问题,快速诊断并定位故障根因。
4j2产生的日志直接上报至云日志服务。具体操作请参见:通过Java SDK(log4j2插件)上报日志 (LTS)。 LOGBack SDK 可以直接在logback中配置华为云appender,将通过logback产生的日志直接上报至云日志服务。具体操作请参见:通过LogBack
运维管理概述 自动化运维服务依托华为云UniAgent运维通道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重