检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看进程的监控视图与告警信息。 在“主机列表”页签,可查看该组件所在的主机概况。 在“监控视图”页签下,选择对应的Prometheus实例,可查看该组件的资源使用情况。单击页面右上角的,可全屏展示资源信息。 在“告警”页签下,可查看该组件的告警详情,详情请参见查看AOM告警或事件。
华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。
称”文本框中设置的阈值规则名称加上0至9的序号(序号和资源选择时的先后顺序有关,先选择的资源序号越小,后选择的资源序号越大)。 图1 选择资源 定义阈值:选择待监控的指标,设置阈值条件、连续周期、告警级别、统计方式等参数,选择是否发送通知。 阈值条件:阈值告警的触发条件,由判断条
性能问题 具体的性能问题的描述。 调用方法 当前问题出现的方法名。 问题出现数 在查询的时间范围内,当前性能问题出现的次数。 CPU使用率 当前问题最后一次出现,所使用的资源(cpu)的使用率。 操作 支持的其他操作类型,目前仅支持查看详情。 单击操作列的“查看详情”,展示某
示“全部实例”的“JVM监控”信息。 图1 基础监控 在“实例名称”和“监控项”下拉框中选择实例与监控项,可以查看该实例在对应采集器下不同指标集的基础监控项指标数据,具体指标及说明请参见:基础监控。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使
通过Debugging诊断线程 线程分析支持显示该应用的所有线程和查看线程的堆栈信息。通过Debugging诊断线程,帮助用户快速定位耗时较高的线程。 约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM
输入类名称并选择方法名,单击“确认”,页面将显示该方法某次执行的具体信息。 图1 方法分析详情 查看执法记录:页面左侧展示该方法的执行记录,包括:耗时明细、调用来源以及方法源码。 耗时明细展示调用方法、耗时时间并支持“下钻”操作。 单击操作列的“下钻”,可以查看此调用方法的详细信息。 查看默认观测项目:页面
)组成的格式为XX.XX的3~32位字符串。 指标维度 维度是指标的分类。每个指标都包含用于描述该指标的特定特征,可以将维度理解为这些特征的类别。 系统指标维度:维度是固定不变的,不同类型的指标维度不同,维度信息的详细说明请参见指标维度。 自定义指标维度:维度为1~32位的字符串,需要您自定义。
认展示“全部实例”的“KafkaProducer监控”信息。 图1 查看消息队列 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用A
”界面。 在左侧导航栏中选择“参数库”,单击右上角的“创建参数”。 填写参数信息,具体的参数说明请参见表1。 图1 填写参数信息 表1 填写参数信息 参数名称 说明 参数类型 参数的类型,目前仅支持字符串类型。 参数名称 参数的名称。 最多可输入64个字符,只能由大小写字母组成。
中“全部实例”的“URL监控”信息。 图1 接口调用 在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如
输入过滤属性和对应的过滤值,指定过滤条件来选择实例。 支持设置多个过滤条件,搜索时多个过滤属性之间为“与”的关系。 该方式对未来新增的实例也生效。 标签 设置标签键和对应的标签值,指定一个或多个标签来选取实例。 选择多个标签时,按照“与”的关系搜索。 该方式对未来新增的实例也生效。 从CMDB中选择
如果在全局页面已选择企业项目,则此处灰化不可选。 描述 分组规则的描述。最多不能超过1024个字符。 告警分组规则 分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。 取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。
及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能,存在应用崩溃的风险。 Debugging诊断仅针对白名单用户开放。
(ECS)云服务数据的访问权限。该权限设置针对整个AOM 2.0服务生效。 前提条件 用户已被授予“AOMFullAccessPolicy ”、“iam:agencies:createAgency”和“iam:agencies:deleteAgency”。授权权限的具体操作请参见创建用户组并授权。
告警抑制规则功能可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小时内的历史数据,形成动态上界,以比对近10分钟的数据是否有异常。支持如下事件类型:
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题
本章以通过告警行动规则名称获取告警行动规则为例。 涉及的基本信息 通过告警行动规则名称获取告警行动规则之前,需要确定要获取的告警行动规则名称,该名称可通过“获取告警行动规则列表”接口查询,也可以通过在AOM 2.0console界面查询到的告警行动规则名称获取。 获取指定告警行动规则的详细信息 接口相关信息 URI格式:GET