云容器引擎 CCE-监控中心FAQ:云原生监控插件Server模式下为什么不能正常上报指标?
云原生监控插件Server模式下为什么不能正常上报指标?
出现该问题的原因可能为Server模式下插件实例挂载的PV存储空间已满,导致指标无法写入。
请到插件中心,选中prometheus-server-x实例,查看日志。如果日志中存在:“no space left on device”类似的日志打印,则说明Prometheus挂载的磁盘空间不足。
解决方案
- 方案一:推荐使用Agent模式,对接 AOM 实例。使用AOM托管指标数据,无需管理存储。
- 方案二:在左侧导航栏中选择“存储”,并切换至monitoring命名空间,选中pvc-prometheus-server-0的磁盘,扩容对应的存储资源。扩容完成后前往有状态负载页面,将prometheus-server的实例重启。
图6 扩容PVC
在磁盘空间不足后已无法写入Prometheus指标,将导致数据无法采集,因此扩容完成重启后,该时段的监控数据将会丢失。