数据仓库服务 GAUSSDB(DWS)-数据倾斜导致SQL执行慢,大表SQL执行无结果:原因分析

时间:2024-06-21 08:56:55

原因分析

GaussDB (DWS)支持Hash、REPLICATION和ROUNDROBIN(8.1.2集群及以上版本支持ROUNDROBIN)分布方式。如果创建了Hash分布的表,未指定分布键,则选择表的第一列作为分布键,这种情况就可能存在倾斜。倾斜造成以下负面影响:

  • SQL的性能会非常差,因为数据只分布在部分DN,那么SQL运行的时候就只有部分DN参与计算,没有发挥分布式的优势。
  • 会导致资源倾斜,尤其是磁盘。可能部分磁盘的空间已经接近极限,但是其他磁盘利用率很低。
  • 可能出现部分节点CPU过高等问题。
support.huaweicloud.com/trouble-dws/dws_09_0072.html