回顾Kubernetes中对生产集群诉求的总结:
高可用的架构设计;
弹性伸缩 的能力;
对安全与权限管理的更高要求。
基于以上评判标准,就可以发现:从生产集群角度评估,选型/部署只是第一步。真正复杂的是Kubernetes及相关插件的长期监控运维、持续的迭代演进、CVE漏洞的快速分析/修复测试/方案推送等等。
从华为云CCE的实践看,不止一次地碰到过相对棘手的问题。例如:OS内核缺陷导致的可靠性问题,例如cgroup的kmem泄露;Docker的bug导致的稳定性问题等。
可以发现,生产集群的维护是一个长期的、庞杂的、系统性的任务,如果每一个Kubernetes的使用者都陷入到上述的柴米油盐中,即使Kubernetes作为容器平台事实标准,其光辉也会因此稍显暗淡。