检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
性能分析 Profiler性能分析,自动获取应用程序运行过程中CPU和内存和时延的使用情况,通过火焰图实时展示每一个方法、类和线程的调用关系和执行效率,帮助优化代码性能。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧
指定类型为application/json。 region 是 String Prometheus实例所属Region,一般为承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同。 表3 请求Body参数 参数 是否必选 参数类型 描述 prom_name 是 String Prometheus实例名称
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
事件巡检 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小时内的历史数据,形
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" , "key1" : "value1" // 创建告警规则时配置的告警标签
概述 传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 注意事项 如需
查看告警 告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。“告警列表”页面提供告警查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能:
创建Prometheus实例 Prometheus实例 for 云服务 Prometheus实例 for ECS Prometheus实例 for CCE Prometheus 通用实例 Prometheus实例 for 多账号聚合实例 父主题: Prometheus监控
创建分组规则 使用分组规则,可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" , "key1" : "value1" // 创建告警规则时配置的告警标签
接入概述 Prometheus监控对常用的基础设施、中间件、自定义组件等进行了集成,通过创建采集任务执行插件脚本,就可以对相应的组件进行监控,结合应用运维管理平台和开源Grafana可以提供一站式全方位的监控体系,帮助业务快速发现和定位问题,减轻故障给业务带来的影响。 已接入的组
应用概览 应用概览页面,展示应用维度的指标数据,包含核心指标,url调用次数,url平均响应时间等。同时支持“购买特惠包”以及“接入应用”。 查看应用概览 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 应用概览”,展示应用维度的指标数据,详细指标说明请参见表1。 图1
设置全屏模式在线时长 为保障客户信息的安全性,AOM提供了在线超时退出机制,即:登录控制台后,打开任意一个界面,如果在1小时内无任何操作,则会自动退出到登录界面。 当在使用AOM的仪表盘全屏模式进行监控时,全屏模式会随着用户账号的退出而退出,无法实时进行监控。为满足您的多样化需求,AOM支持您自定义全屏模式在线时长。
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
全局开关 “指标采集开关”用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。“告警消息内容显示资源的TMS标签”开关用来控制告警通知的消息内容是否显示不同云资源的标签。该权限设置针对整个AOM 2.0服务生效。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。
PAAS.NODE: 主机指标、网络指标、磁盘指标和文件系统指标的命名空间,PAAS.SLA:SLA指标的命名空间,PAAS.AGGR:集群指标的命名空间,CUSTOMMETRICS:默认的自定义指标的命名空间。 枚举值: PAAS.CONTAINER PAAS.NODE PAAS
代理区域管理 为解决多云之间网络互通,需要在华为云购买和配置ECS主机为代理机,同时代理机上需要绑定公网IP,AOM通过该代理机下发部署控制命令到远程主机,运维数据也将经过该代理机至AOM。代理区是由多个代理机组成,主要是考虑代理机高可用。 代理区域 代理机 父主题: 采集设置
日志 日志监控项可以日志,通过日志来分析和定位问题。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列,某一个组件名称,进入该组件指标项详情页,默认展示“接口调用”详细信息。
首页介绍 资源检索 资源检索提供应用、主机等资源的检索功能,支持通过ID、关键字、名称等方式快速检索资源。 图1 资源检索 搜索条件只允许输入2~124字符。 允许输入多个ID、关键字或名称搜索,多个搜索条件之间请用“,”间隔。例如搜索名称包含“AOM”和“LTS”的应用或资源,可在搜索框输入“aom
ICAgent安装类常见问题 如何创建终端节点? 如何启用NGINX stub_status模块? APM指标数据未采集上来,可能有哪些原因? ECS主机上执行UniAgent安装命令,下载安装脚本失败