数据仓库服务 GAUSSDB(DWS)-如何调整GaussDB(DWS)分布列?:选择合适的分布列

时间:2024-09-23 15:49:12

选择合适的分布列

Hash分布表的分布列选取至关重要,需要满足以下基本原则:

  • 列值应比较离散,以便数据能够均匀分布到各个DN。例如,考虑选择表的主键为分布列,如在人员信息表中选择身份证号码为分布列。
  • 在满足第一条原则的情况下尽量不要选取存在常量filter的列。
  • 在满足前两条原则的情况,考虑选择查询中的连接条件为分布列,以便Join任务能够下推到DN中执行,且减少DN之间的通信数据量。
  • 支持多分布列特性,可以更好地满足数据分布的均匀性要求。
support.huaweicloud.com/dws_faq/dws_03_2126.html