检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Thin pool 元数据空间使用率 (aom_host_diskpartition_thinpool_metadata_percent) 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) Thin pool 数据空间使用率 (aom_host_
us_JVM_CPU_Time jobmanager中JVM使用的CPU时间。 无 flink_jobmanager_Status_ProcessTree_CPU_Usage JobManager 中JVM的CPU使用率。 无 flink_taskmanager_Status_JVM_CPU_Load
在左侧导航栏中选择“告警 > 事件列表”。 在“事件列表”页面中查看事件。 设置时间范围,查看已设时间范围内产生的事件。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时、近一天等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为31天。
可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中
指标举例 组件(进程) CPU内核总量、CPU内核占用、CPU使用率等 主机网络 接收Bps、接收错包率、发送错包率、总Bps。 主机磁盘、文件系统 磁盘读取速率、磁盘写入速率、磁盘使用率。 主机指标 CPU内核总量、物理内存使用率、主机状态、NTP偏移量。 应用性能指标 请求平均时延、错误调用次数、请求吞吐量。
告警规则分为阈值规则和事件类告警规则两种。通常情况下,通过阈值规则,实时监控环境中主机、组件等资源使用情况。当资源使用告警过多,告警通知过于频繁时,通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创
Authorization:签名认证信息,可选,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。AK/SK认证的详细说明请参见AK/SK认证。 X-Sdk-Date:请求发送的时间,可选,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该
快速分析应用健康状态。 资源监控使用说明 告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,当AOM自身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。 告警管理使用说明 父主题: 安全
cce_gpu_utilization gpu卡算力使用率 cce_gpu_memory_utilization gpu卡显存使用率 cce_gpu_encoder_utilization gpu卡编码使用率 cce_gpu_decoder_utilization gpu卡解码使用率 cce_gpu_utilization_process
状态、资源使用情况等信息。单击组件名称,可查看该组件所有实例的概况;单击实例名称,可查看进程的监控视图与告警信息。 在“主机列表”页签下,可查看该应用的主机运行状态、资源使用情况等信息。 在“监控视图”页签下,选择对应的Prometheus实例,可查看该应用的资源使用情况。单击页面右上角的,可全屏展示资源信息。
的操作。 图2 查看线程分析信息 表1 线程分析参数说明 参数名称 说明 线程名称 线程具体名称。 线程ID 线程的ID。 CPU使用率 CPU使用率。 状态 线程状态,包括:NEW、BLOCKED、WAITING、TIMED_WAITING、TERMINATED以及RUNNABLE。
况,用于直观分析数据变化趋势。当需要监控一段时间内一个或多个资源的指标数据趋势时,请使用此类型图表。 使用折线图可对不同资源的同一指标进行对比,如下图所示,在同一个图表中展示了不同主机的CPU使用率。 图1 折线图 表1 折线图图表配置说明 参数类别 参数名称 说明 图形配置 连接方式
况,用于直观分析数据变化趋势。当需要监控一段时间内一个或多个资源的指标数据趋势时,请使用此类型图表。 使用折线图可对不同资源的同一指标进行对比,如下图所示,在同一个图表中展示了不同主机的CPU使用率。 图1 折线图 表1 折线图图表配置说明 参数类别 参数名称 说明 - X轴名称
监控一段时间内一个或多个资源的指标数据趋势时,请使用此类型图表。 使用曲线图可对不同资源的同一指标进行对比,如下图所示,在同一个图表中展示了不同组件的CPU内核总量。 图1 曲线图 数字图:当需要实时监控某个指标的最新数值时,可使用此类型的图表。 如下图所示,可实时查看组件的上行bps的平均值。
开始迁移,弹框显示“迁移中”。 图3 迁移中 迁移完成,单击“迁移完成”弹框中的“开始使用 AOM 2.0”,进入AOM 2.0控制台。 图4 迁移完成 迁移完成后,单击过“迁移完成”弹框中的“开始使用AOM 2.0”,再次进入AOM 1.0控制台会自动跳转到AOM 2.0控制台。如果需要回到AOM
迁移注意事项弹框 开始迁移,弹框显示“迁移中”。 图3 迁移中 迁移完成,单击“迁移完成”弹框中的“开始使用 AOM 2.0”,进入AOM 2.0控制台。 迁移完成后,单击过“迁移完成”弹框中的“开始使用AOM 2.0”,再次进入AOM 1.0控制台会自动跳转到AOM 2.0控制台。如果需要回到AOM
、API请求、服务的运营相关指标(PV/UV)情况,实时了解并追踪应用性能情况。 通过用户会话追踪,定位使用过程中影响用户体验的慢请求、慢加载、慢交互等问题,实时了解用户使用情况。 通过页面加载性能分析,提供多维度页面的首屏时间、白屏时间、可交互时间等页面加载指标数据,全面还原用户的体验感受,定位访问慢的原因。
通用配置”。 登录APM控制台。 在左侧导航栏选择“系统管理 > 通用配置”。 通用配置 探针统计 支持对租户使用的探针数量进行统计,您可以从多个维度(时间、区域、探针类型)查看租户使用的探针数量。 登录AOM 2.0控制台。 在左侧导航栏选择“APM配置 > 探针统计”。 登录APM控制台。
系统预置的容器类型仪表盘需要在CCE集群下的“插件管理”中安装“kube-prometheus-stack”插件后,才能正常使用。 系统预置的原生中间件类型仪表盘需要在UniAgent中创建中间件采集任务后,才能正常使用。 系统预置的云服务类型的dms-rabbitmq仪表盘,在RabbitMQ AMQP-0-
需版(按需计费)来修改。 指标配置 指标采集开关用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。 使用流程 AOM使用流程如下图所示。 图1 AOM使用流程 开通AOM(必选) 创建子账号并设置权限(可选) 购买云主机(必选) 安装ICAgent(必选) ICAge