数据仓库服务 GAUSSDB(DWS)-ALTER TABLE PARTITION:语法格式

时间:2024-09-05 10:32:16

语法格式

  • 修改表分区主语法。
    1
    2
    ALTER TABLE [ IF EXISTS ] { table_name  [*] | ONLY table_name | ONLY ( table_name  )}
        action [, ... ];
    
    其中action统指如下分区维护子语法。当存在多个分区维护子句时,保证了分区的连续性,无论这些子句的排序如何, GaussDB (DWS)总会先执行DROP PARTITION再执行ADD PARTITION操作,最后顺序执行其它分区维护操作。
    1
    2
    3
    4
    5
    6
    7
    8
    9
        modify_clause  |
        rebuild_clause |
        exchange_clause  |
        row_clause  |
        merge_clause  |
        split_clause  |
        add_clause  |
        drop_clause  |
        truncate_partitioned_clause
    
    • modify_clause子语法用于设置分区索引是否可用。
      1
      MODIFY PARTITION partition_name { UNUSABLE LOCAL INDEXES | REBUILD UNUSABLE LOCAL INDEXES }
      
    • rebuild_clause子语法用来重建分区的索引。该语法仅8.3.0.100及以上集群版本支持。
      1
      REBUILD PARTITION partition_name [ WITHOUT UNUSABLE ]
      
    • exchange_clause子语法用于把普通表的数据迁移到指定的分区。
      1
      2
      3
      EXCHANGE PARTITION { ( partition_name ) | FOR ( partition_value [, ...] ) } 
          WITH TABLE {[ ONLY ] ordinary_table_name | ordinary_table_name * | ONLY ( ordinary_table_name )} 
          [ { WITH | WITHOUT } VALIDATION ] [ VERBOSE ]
      

      进行交换的普通表和分区表必须满足如下条件:

      • 普通表和分区表的列数目相同,对应列的信息严格一致,包括:列名、列的数据类型、列约束、列的Collation信息、列的存储参数、列的压缩信息、已删除字段的数据类型等。
      • 普通表和分区表的表压缩信息严格一致。
      • 普通表和分区表的分布列信息严格一致。
      • 普通表和分区表的索引个数相同,且对应索引的信息严格一致。
      • 普通表和分区表的表约束个数相同,且对应表约束的信息严格一致。
      • 普通表不可以是临时表和unlogged表。
      • 普通表和分区表应该在同一个逻辑集群或节点组(NodeGroup)中,如果不在同一个逻辑集群或节点组,将会采用将数据插入对方表内方式来实现交换分区,这样交换分区的时间与表数据量有关,对于数据量非常大的表和分区表,交换分区将会非常耗时。
      • 在在线扩容重分布场景下,如果普通表和分区表正在重分布,交换分区语句有可能中断正在重分布的普通表或分区表(取决于交换分区和重分布语句是否产生锁冲突),通常重分布的普通表或分区表被中断后会重试2次,但同一个表交换分区执行过于频繁可能导致普通表或分区表多次重试重分布都失败。如果普通表重分布过程被交换分区操作打断,在重试重分布时,数据已经被替换为原分区表中的数据,会重新进行全量重分布。
      • 如果行存分区表中最后一个有效字段后的其他字段全部被删除,在不考虑这些删除字段的情况下,分区表与普通表字段信息一致时,分区表和普通表可以进行交换。
      • 列存普通表和列存分区表的表级参数colversion必须一致:禁止colversion2.0与colversion1.0执行交换分区操作。

      完成交换后,普通表和分区表的数据被置换,同时普通表和分区表的表空间信息被置换。此时,普通表和分区表的统计信息变得不可靠,需要对普通表和分区表重新执行analyze。

    • row_clause子语法用于设置分区表的行迁移开关。
      1
      { ENABLE | DISABLE } ROW MOVEMENT
      
    • merge_clause子语法用于把多个分区合并成一个分区。
      1
      MERGE PARTITIONS { partition_name } [, ...] INTO PARTITION partition_name  
      
      • INTO关键字前的分区称为源分区,INTO关键字后的分区称为目标分区。
      • 源分区个数不能小于2个。
      • 源分区名称不能重复。
      • 源分区不能存在unusable的索引,否则执行会报错。
      • 目标分区名只能跟最后一个源分区的名称相同,或者跟表的所有分区名都不相同。
      • 目标分区的边界是所有源分区边界的并集。
      • 对于范围分区表,所有的源分区必须是边界连续的分区。
      • 对于列表分区,如果源分区中包含DEFAULT分区,那么目标分区的边界也是DEFAULT。
    • split_clause子语法用于把一个分区切割成多个分区。

      范围分区的split_clause语法如下:

      1
      SPLIT PARTITION { partition_name | FOR ( partition_value [, ...] ) } { split_point_clause | no_split_point_clause }
      
      • 指定切割点split_point_clause的语法为:
        1
        AT ( partition_value ) INTO ( PARTITION partition_name  , PARTITION partition_name  )
        

        切割点的大小要位于正在被切割的分区的分区键范围内,指定切割点的方式只能把一个分区切割成两个新分区。

      • 不指定切割点no_split_point_clause的语法为。
        1
        INTO { ( partition_less_than_item [, ...] ) | ( partition_start_end_item [, ...] ) }
        
        • 不指定切割点的方式,partition_less_than_item指定的第一个新分区的分区键要大于正在被切割的分区的前一个分区(如果存在的话)的分区键,partition_less_than_item指定的最后一个分区的分区键要等于正在被切割的分区的分区键大小。
        • 不指定切割点的方式,partition_start_end_item指定的第一个新分区的起始点(如果存在的话)必须等于正在被切割的分区的前一个分区(如果存在的话)的分区键,partition_start_end_item指定的最后一个分区的终止点(如果存在的话)必须等于正在被切割的分区的分区键。
        • partition_less_than_item支持的分区键个数最多为4,而partition_start_end_item仅支持1个分区键,其支持的数据类型参见Partition Key
        • 在同一语句中partition_less_than_item和partition_start_end_item两者不可同时使用;不同split语句之间没有限制。
      • 分区项partition_less_than_item的语法为:
        1
        2
        PARTITION partition_name VALUES LESS THAN ( { partition_value | MAXVALUE }  [, ...] ) 
           
        
      • 分区项partition_start_end_item的语法为,其约束参见START END语法描述
        1
        2
        3
        4
        5
        6
        PARTITION partition_name {
                {START(partition_value) END (partition_value) EVERY (interval_value)} |
                {START(partition_value) END ({partition_value | MAXVALUE})} |
                {START(partition_value)} |
                {END({partition_value | MAXVALUE})}
        } 
        
      列表分区的split_clause语法如下:
      1
      SPLIT PARTITION { partition_name | FOR ( partition_value [, ...] ) } { split_values_clause | split_no_values_clause }
      
      • 指定切割点的split_values_clause的语法为:
        1
        VALUES ( { (partition_value) [, ...] } | DEFAULT } ) INTO ( PARTITION partition_name  , PARTITION partition_name  )
        
        • 如果源分区不是DEFAULT分区,那么切割点所指定的边界是源分区边界的一个非空真子集;如果源分区是DEFAULT分区,那么切割点所指定的边界不能和其它非DEFAULT分区的边界存在重叠。
        • 切割点的指定的边界是INTO关键字后面的第一个分区的边界,源分区边界与切割点的指定的边界的差集是第二个分区的边界。
        • 当源分区是DEFAULT分区时,第二个分区的边界还是DEFAULT。
      • 不指定切割点的split_no_values_clause的语法为:
        1
        INTO ( list_partition_item [, ....], PARTITION partition_name )
        
        • 此处的list_partition_item和创建列表分区表的时候指定分区的语法一样,除了此处的分区定义中边界值不能为DEFAULT。
        • 除了最后一个分区,其他分区需要显式定义边界,定义的边界不能是DEFAULT,并且必须是源分区边界的非空真子集。最后一个分区的边界是源分区边界与其它分区边界的差集,且最后一个分区的边界为空(即差集不能为空集)。
        • 如果源分区是DEFAULT分区,则最后一个分区的边界为DEFAULT。
    • add_clause子语法用于为指定的分区表添加一个或多个分区。
      范围分区的add_clause语法如下:
      1
      ADD { partition_less_than_item... | partition_start_end_item }
      
      • 使用partition_less_than_item语法时,分区表必须是范围分区表,否则执行会报错。
      • 此处partition_less_than_item和创建范围分区表的时候指定分区的语法一样。
      • 当前分区表的最后一个分区的边界为MAXVALUE,不允许添加新的分区,否则执行会报错。

      列表分区的add_clause语法如下:

      1
      ADD list_partition_item
      
      • 使用list_partition_item语法时,分区表必须是列表分区表,否则执行会报错
      • 此处的list_partition_item和创建列表分区表的时候指定分区的语法一样
      • 当前分区表存在DEFAULT分区时,不允许添加新的分区动作,否则执行会报错
    • drop_clause子语法用于删除分区表中的指定分区。
      1
      DROP PARTITION  { partition_name | FOR (  partition_value [, ...] )  } 
      
    • drop_clause子语法支持删除多个分区语法。(8.1.3.100及以上集群版本支持。)
      1
      DROP PARTITION  { partition_name [, ... ] }
      
    • truncate_partitioned_clause子语法用于清理表分区的数据。
      1
      TRUNCATE PARTITION { partition_name | FOR (  partition_value  [, ...] )  } ;
      

      使用PARTITION FOR子句时,partition_value所在的整个分区会被清空。

  • 修改表分区名字的语法。
    1
    2
    ALTER TABLE [ IF EXISTS ] { table_name [*] | ONLY table_name | ONLY ( table_name  )}
        RENAME PARTITION { partition_name | FOR ( partition_value [, ...] ) } TO partition_new_name;
    
support.huaweicloud.com/sqlreference-830-dws/dws_06_0143.html