数据仓库服务 GAUSSDB(DWS)-TABLE对象设计规范(重点):规则2.11 创建表时必须选择正确的分区策略

时间:2024-12-24 11:19:59

规则2.11 创建表时必须选择正确的分区策略

违反规范的影响

分区的优点如下,如不做分区,其查询性能和 数据治理 效率会下降,数据量越大这种劣化越大。

  • 改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索效率。
  • 提升数据治理效率:如数据生命周期管理场景,针对历史分区做TRUNCATE/DROP PARTITION,效率和效果远优于DELETE。

方案建议

  • 针对包含时间类型字段的表设计分区。
表3 分区策略选择

分区策略

描述

适用场景

范围分区(Range Partitioning)

根据分区键值的范围,将数据存储到不同的分区中,分区键范围连续但不重叠。

  1. 日期或者时间类的字段作为分区键。
  2. 查询中大多包含分区键作为过滤条件。
  3. 定期按照分区键清理数据。

列表分区(List Partitioning)

根据分区键值的列表进行分区,各分区的列表值不重复

  1. 特定数量的枚举值作为分区键值。
  2. 查询中大多包含分区键作为过滤条件。
support.huaweicloud.com/devg-910-dws/dws_04_0112.html