检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过AOM查看事件巡检数据 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小
Query参数 参数 是否必选 参数类型 描述 action 否 String 接口请求动作: 不传或者传其他值:代表上报告警或事件动作。该参数值默认为空,即默认上报告警或事件。 clear:代表清除告警动作。 枚举值: clear 请求参数 表3 请求Header参数 参数 是否必选
开通智能洞察 AOM智能洞察引擎持续监控您的应用和资源,通过历史数据和问题特征发现问题,并针对每个问题会给出相应的根因分析和建议。 功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。
开通自动化运维 开通自动化运维时,因为不同区域是互相隔离的,对于不同的区域(例如:华北-北京一、华南-广州等),您需分别进行开通操作。 用户首次登录开通自动化运维,需要添加Security Administrator角色,后续使用自动化运维服务则不需要此角色权限。 自动化运维功能
智能洞察(BETA) 开通智能洞察 通过AOM查看事件巡检数据 通过AOM查看事件根因分析结果 通过AOM查看故障传播链
运维管理概述 自动化运维服务依托华为云UniAgent运维通道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重
查看场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 运维配置
通用场景:管理脚本、管理文件。 云服务场景:启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。 软件部署:暂时为空。 日常巡检:暂时为空。 故障处理:清理磁盘空间。 卡片管理 在工具市场页面,可以直接使用卡片创建任务,也可以对非通用场景卡片进行下架、上架或设置操作,具体操作如表1。
心中可以接入需要监控的业务层、应用层、中间件层、基础设施层指标,在仪表盘中实现个性化监控,以及通过统一告警入口配置告警规则,实现业务的日常巡检,保障业务的正常运行。 AOM提供多场景、多层次、多维度指标数据的监控能力,建立了从基础设施层指标、中间件层指标、应用层指标到业务层指标的
自动化运维自定义策略 如果系统预置的自动化运维权限不能满足您的授权要求,您可以创建自定义策略。自定义策略中可以添加的授权项(Action),请参考策略和授权项说明。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服
创建AOM日志告警规则 AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流。 已使用新版结构化功能。结构化配置请参见:日志结构化配置。 已创建相关日志流的图表。创建方法请参见:日志可视化。
删除指标 删除一个指标:在“操作”列中单击。 删除一个或多个指标:选中一个或多个指标前的复选框,单击页面上方的“删除”。 导出监控报告 单击“导出报告”,可将该指标图表以CSV格式导出,以便进行本地存储及进一步分析。 表3 相关操作 操作 说明 添加指标图表到仪表盘 选择指标后,
择对应的时间段,时间可精确至秒数。单击“确定”后,可根据选择时间查询仪表盘中所有图表数据。 导出监控报告 选择待操作的仪表盘,在“仪表盘”页面右上角单击,选择“导出折线图监控报告”,可将该指标的折线图表以CSV格式导出,以便进行本地存储及进一步分析。 父主题: Prometheus监控
据满足阈值条件时产生阈值告警。 创建AOM日志告警规则 AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。 创建云监控告警规则 云监控服务支持灵活的创建告警规则。您既可以根据实际需要对某个特定的监控指标设置自定义告警规则,同时也支持使用
便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、日志分析、服务异常报警等功能,支持日常巡检资源、应用整体运
基本概念 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都
通过AOM查看事件根因分析结果 智能洞察提供异常事件快速根因定位分析的功能。根因分析基于事件巡检看护的服务历史数据,根据服务指标、调用链数据进行下钻分析,细粒度定位事件根因。 查看事件根因分析结果 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角
e创建应用。 指标浏览 指标浏览展示了各资源的指标数据,您可实时监控指标值及趋势,还可将关注的指标添加到仪表盘,对其创建阈值规则和导出监控报告等操作,以便实时查看业务及分析数据。 云服务监控 云服务监控展示华为云各服务实例的历史性能数据曲线。最长可查看近6个月内的数据,有助于用户了解实例运行状况。
片,也可以根据自身需求定制相应的工具卡片。可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作,具体操作参见清理磁盘空间。 日常巡检 日常巡检默认为空,可以根据自身需求定制相应的工具卡片。可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作。 父主题: 服务场景
查看AOM告警或事件 “告警列表”页面提供告警和事件的查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能: 告警列表:支持按告警级别图形化查看告警信息。 高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。