检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
认展示“全部实例”的“GRPCServer监控”信息。 图1 查看远程过程调用 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围:
认展示“全部实例”的“KafkaProducer监控”信息。 图1 查看消息队列 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围:
接口调用”页签中“全部实例”的“URL监控”信息。 图1 接口调用 在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围:
a/b/c,a、b、c各代表一层。 选填 用户应用 用户所属的应用名称。 必填 监控JAVA应用(为部署在CCE容器中的JAVA应用安装Agent) AOM提供应用接入功能,可以为部署在CCE容器中的JAVA应用安装APM探针Agent,来监控JAVA应用,以提供更精准的问题分析与定位,协助您高效解决应用难题。
方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。 单击列表右上的,可以导
查询端口连通性。 执行以下命令,获取ACCESS的IP地址。 cat /opt/oss/servicemgr/ICAgent/envs/ICProbeAgent.properties | grep ACCESS_IP 依次执行以下命令,检查8149端口的连通性。 curl -k https://ACCESS_IP:8149
在主机页签,单击待移除主机所在行“操作”列的“移除”。 在弹出的移除主机页面,单击“确定”,将该主机移除。 说明: 自定义标识主机组下的主机不支持该操作。 批量移除主机 在主机组列表,单击待修改的主机组所在行前的。 在主机页签,勾选待移除的主机,单击“批量移除”。 单击“确定”。 说明: 自定义标识主机组下的主机不支持该操作。
以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap | grep establish -i 图1 查看hostIP地址 执行以下命令,查看IP地址对应的网卡,如图2所示。 ifconfig
单击“数据库”,切换至数据库页签。默认展示“全部实例”的“Mysql数据库”信息。 图1 数据库 在下拉列表中选择想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围:
如何启用NGINX stub_status模块? Nginx Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,以root权限
取消选中可选列前的单选框,自定义可选列的展示与隐藏。 单击列表右上的,可以导出当前页的列表信息,最大支持导出100条。 单击“当前线程数”、“busy线程数”、“busy线程数峰值”等列的蓝色字体数值,可以查看所选时间段内该Web容器的趋势图。 单击“版本”列的版本信息,可以查看对应版本详情。
_total 传输时丢弃的累积计数 node_network_transmit_errs_total 传输时遇到的错误累积计数 node_network_up 网卡的状态 node_network_transmit_packets_total 传输数据包的累积计数 node_ne
2(20%),可能有如下情况: 在整个时间间隔内,有20%的SM的Tensor Core以100%的利用率运行。 在整个时间间隔内,有100%的SM的Tensor Core以20%的利用率运行。 在整个时间间隔的1/5时间内,有100%的SM上的Tensor Core以100%利用率运行。 其他组合模式。
该指标用于统计测量对象的NPU存储容量。 说明: 仅支持CCE类型主机的NPU指标采集。 >0 兆字节(MB) aom_node_npu_memory_usage NPU存储使用率 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。 说明: 仅支持CCE类型主机的NPU指标采集。 0~100 百分比(%)
causeType 发生异常的类 exceptionType 异常类型 数量 该异常的发生次数 异常消息 该异常产生的异常消息 异常堆栈 该异常产生的堆栈信息 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作:
在default、ECS、CCE、通用实例类型的Prometheus实例的“设置”页签,可以获取当前Prometheus实例的Remote Write地址。将原生Prometheus的指标通过Remote Write上报到AOM服务端,即可实现时序数据的长期存储。 如果已经部署并正在使用开源Prometheus,可直接进行4。
实例列表”。 在Prometheus实例列表中,单击支持数据多写功能的Prometheus实例的名称,进入该实例的详情界面。 在左侧导航栏单击“数据多写”。 设置配置流程。 选择终端节点服务。请从下拉列表选择合适的终端节点服务。 选择的终端节点服务需要和自建Prometheus是同一个VPC
<100(例如,已打印90条日志),该日志之后已打印的日志条数 <99(例如,已打印80条日志),则该日志之前的90条和之后的80条日志会被作为上下文显示。 单击“导出本页”,可将已显示的日志上下文原始数据导出到本地。 为了保障租户主机和组件的正常运行,租户的主机上会运行部分系统提供的组件(例如,kube-d
PM类型的Prometheus实例并显示在AOM控制台的“Prometheus监控 > 实例列表”界面。 约束与限制 使用“多指标”和“满足全部条件触发”的计算方式创建的告警规则,在监控两个及两个以上的指标时,需要同时满足以下条件才会触发告警: 指标的指标数据满足设置的检测规则。
oaded JobManager自JVM启动以来加载的类的总数。 无 flink_jobmanager_Status_JVM_ClassLoader_ClassesUnloaded JobManager自JVM启动以来卸载的类的总数。 无 flink_taskmanager_St