qcloud 各位大佬: 我刚成功搭建了KubeSphere2.1.1的集群沟通,1个master+2个node。可刚才其中的一个node服务器突然挂掉了,按照道理来说,KubeSphere的集群是可以正常运行的,对吧,可现在发现很多服务都无法自动重建。 这是否可以说这个集群没有达到分布式的效果。 请各位大佬帮忙分析分析
Feynman qcloud 你 1m 2n 并不是高可用集群。需要 3 master 才是高可用集群。 其它节点的内存和 CPU 还有多少?如果内存不够或者节点有污点 这些 Pod 也无法调度过去的,这是 K8s 的机制。
zheng1 qcloud 节点数太少了,这样的测试结果是没有意义的。不能只看内存,也要看每个pod的request。 建议要测试的话,至少也要4 * 8G 个node进行这种灾难测试。如果要测试master高可用,需要三个master节点。