检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源监控使用说明 满足内置发现规则的服务,安装ICAgent后该服务会自动被发现;对于不满足内置应用发现规则的服务,您则需配置应用发现规则。 资源监控使用说明如下: 图1 资源监控使用说明 父主题: 资源监控
创建AOM日志告警规则 AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流。 已使用新版结构化功能。结构化配置请参见:日志结构化配置。 已创建相关日志流的图表。
指标浏览 指标浏览展示了各资源的指标数据,您可实时监控指标值及趋势,还可对关注的指标进行创建阈值规则等操作,以便实时查看业务及分析数据关联分析。 监控指标 在左侧导航栏中选择“监控 > 指标浏览”。 选择指标: 华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、西南
通过AOM查看事件巡检数据 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小时内的历史数据
通过AOM查看事件根因分析结果 智能洞察提供异常事件快速根因定位分析的功能。根因分析基于事件巡检看护的服务历史数据,根据服务指标、调用链数据进行下钻分析,细粒度定位事件根因。 查看事件根因分析结果 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围
快速分析日志流中的日志 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息
管理日志接入 AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中“接入管理”功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 约束与限制 需要先购买云日志服务的相关功能,才可以使用AOM 2.0
查看场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 运维配置
添加阈值 该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 通过阈值规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 AOM已对接消息通知服务(Simple Message
日志设置 AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中日志设置相关功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 约束与限制 需要先购买云日志服务的相关功能,才可使用AOM 2.0控制台中日志设置相关功能
标准输出配置 通过添加指定采集容器标准输出标签,用户可以指定采集pod下的对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout
认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。 Token认证:通过Token认证调用请求。 AK/SK认证 AK/SK签名认证方式仅支持消息体大小
管理主机组 AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中“主机组管理”功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 您需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“
管理主机组 AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中“主机组管理”功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 您需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“
日志 “√”表示支持,“x”表示暂不支持。 表1 日志 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询日志 POST /v1/{project_id}/als/action aom:log:list √ × 父主题
查看Prometheus实例指标上报量 通过Prometheus监控服务将指标数据上报到AOM后,即可查看Prometheus实例上报的基础指标和自定义指标数量,方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus
创建告警行动规则 前提条件 已创建一个主题,操作详见创建主题。 已设置主题策略,操作详见设置主题策略。 已为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 注意事项 您最多可创建1000个告警行动规则,如果告警行动规则数量已达上限1000时,请删除不需要的行动规则
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上报的信息