云容器引擎 CCE-监控中心FAQ:云原生监控插件Server模式下为什么不能正常上报指标?

时间:2024-05-31 08:37:36

云原生监控插件Server模式下为什么不能正常上报指标?

出现该问题的原因可能为Server模式下插件实例挂载的PV存储空间已满,导致指标无法写入。

请到插件中心,选中prometheus-server-x实例,查看日志。如果日志中存在:“no space left on device”类似的日志打印,则说明Prometheus挂载的磁盘空间不足。

图5 查看Prometheus实例日志

解决方案

  • 方案一:推荐使用Agent模式,对接 AOM 实例。使用AOM托管指标数据,无需管理存储。
  • 方案二:在左侧导航栏中选择“存储”,并切换至monitoring命名空间,选中pvc-prometheus-server-0的磁盘,扩容对应的存储资源。扩容完成后前往有状态负载页面,将prometheus-server的实例重启。
    图6 扩容PVC

    在磁盘空间不足后已无法写入Prometheus指标,将导致数据无法采集,因此扩容完成重启后,该时段的监控数据将会丢失。

support.huaweicloud.com/usermanual-cce/cce_10_0803.html