检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 AOM提供了告警通知功能,您可通过创建通知规则进行详细配置,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,可利用此功能将告警信息通过邮件或短信发送给您指定的人员,以便提醒相关人员及时采取措施清除故障,避免造成业务损失。
WAF、云堡垒机 CBH、消息通知服务 SMN、内容分发网络 CDN 指标 云服务接入AOM 开源监控系统接入 Prometheus通用实例 指标 开源监控系统接入AOM Prometheus API/SDK接入 应用运维管理AOM API 指标 通过API接入相关的指标数据。 Prometheus
通过grafana查看AOM中的指标数据 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。 操作步骤 安装并启动Grafana,具体操作请参见Grafana官方文档。 添加AccessCode。
确保本地浏览器的时间与弹性云服务器的时区、时间一致。 注意事项 非华为云上的服务器安装ICAgent时,系统自动生成的跳板机转发命令不包含域名信息,即不支持通过域名方式安装ICAgent。 操作步骤 非华为云上的服务器安装ICAgent,请先在华为云上购买一台弹性云服务器作为跳板机,然后执行如下操作:
为您最近使用过的6个卡片。 设置搜索条件,快速查询需要接入的指标、日志或调用链。 快速筛选:通过勾选“数据源”或“类型”前的复选框进行筛选。 图1 快速筛选 属性筛选:单击搜索框,可以通过“关键词”、“数据源”、“类型”进行搜索,也可以直接在搜索框中输入关键词进行搜索。 图2 搜索框搜索
如何通过创建委托获取AK/SK? 通过创建委托,ICAgent自动获取用户的访问密钥(AK/SK)帮助用户进行应用性能管理。 创建委托 登录华为云控制台。 单击右上角的用户名称,如图1,选择“统一身份认证”。 图1 用户名称 在“统一身份认证”页面中,单击“委托”,进入委托页面。
该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM可以支持设置阈值告警的指标类型如下。
创建静默规则 通过静默规则,您可以在指定时间段屏蔽告警通知,静默规则一旦创建完成,即刻生效。 创建静默规则 用户最多可创建100条静默规则。 在左侧导航栏中选择“告警 > 告警降噪”。 在“静默规则”页签下单击“创建静默规则”,设置规则名称、静默条件等信息。 图1 创建静默规则 表1
保罗一和拉美-圣地亚哥区域生效。 通过阈值规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 AOM已对接消息通知服务(Simple Message Notification,简称SMN),通过在SMN界面设置通知策略,当
通过AOM监控应用进程 应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。应用的类型包括系统应用和自定义应用,通过内置发现规则发现的是系统应用,通过自定义规则发现的是自定义应用。应用列表展示了每个应用的名称、运行状态、部署方式等信息。AOM支持从应用下钻到组件,再从
操作文档。 接入指标(AOM):AOM提供云服务指标接入AOM的能力。通过云服务卡片的“接入指标(AOM)”链接,可快速接入云服务相关指标。 接入日志(LTS)简介:AOM提供云服务日志接入LTS的入口。通过云服务卡片的“接入日志(LTS)简介”链接,查看云服务日志接入LTS的相
通过AOM监控主机 主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICA
时间段的历史数据。 设置时间范围,查看已设时间范围内上报的指标。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。 设置信
通过Debugging诊断方法 方法分析支持检查正在运行的方法的耗时明细、调用来源以及方法源码。通过Debugging诊断方法,帮助用户快速定位问题的根本原因,以及问题线下无法复现或日志缺失等场景。 通过Debugging诊断方法 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
通过AOM监控进程 配置AOM应用发现规则 通过AOM监控应用进程 通过AOM监控组件进程 父主题: 基础设施监控
通过AOM监控组件进程 组件即您部署的服务,包括容器和普通进程。组件列表展示了每个组件的名称、运行状态、所属应用等信息。AOM支持从组件下钻到实例,从实例下钻到进程。通过各层状态,您可完成对组件的立体监控。 约束与限制 每个组件最多可以创建五个标签。 标签键值长度不超过36个字符,标签值长度不超过43个字符。
通过Debugging诊断对象 对象分析用于分析某个对象内部状态,并支持查看对象参数值和详细信息。 通过Debugging诊断对象 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。
单次创建告警规则可选择的被监控对象数 5000 不限制,支持全部资源、正则匹配、精准匹配。 聚合告警 不支持 支持基于PromQL语法的聚合告警,例如:按CDN总带宽、EIP总带宽和OBS存储等条件聚合告警。 对接线下Grafana 不支持 支持以Prometheus数据源的方式直接对接到线下Grafana。
通过Debugging诊断线程 线程分析支持显示该应用的所有线程和查看线程的堆栈信息。通过Debugging诊断线程,帮助用户快速定位耗时较高的线程。 约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM