云容器引擎 CCE-cgroup统计资源异常导致kubelet驱逐Pod:故障现象

时间:2024-01-05 17:22:36

故障现象

ARM架构节点上,cgroup统计资源异常导致kubelet驱逐Pod,节点无法正常使用。

kubelet一直在驱逐pod,把容器全终止之后还是认为内存不足。

此时实际资源使用正常。

查看/sys/fs/cgroup/memory目录下cgroup的usage_in_bytes统计值有问题,与实际不符。

# cd /sys/fs/cgroup/memory
# cat memory.usage_in_bytes
17618837504
support.huaweicloud.com/cce_faq/cce_faq_00318.html