云数据库 GAUSSDB-创建和管理序列:注意事项

时间：2024-11-02 18:48:11

云数据库 GAUSSDB

注意事项

新序列值的产生是靠GTM维护的，默认情况下，每申请一个序列值都要向GTM发送一次申请，GTM在当前值的基础上加上步长值作为产生的新值返回给调用者。GTM作为全局唯一的节点，势必成为性能的瓶颈，所以对于需要大量频繁产生序列号的操作，如使用Bulkload工具进行数据导入场景，是非常不推荐产生默认序列值的。比如，在下面所示的场景中， INSERT FROM SELECT语句的性能会非常慢。

  
       openGauss=# CREATE SEQUENCE newSeq1;
openGauss=# CREATE TABLE newT1
           ( 
             id   int not null default nextval('newSeq1'), 
             name text
            );
openGauss=# INSERT INTO newT1(name) SELECT name from T1;

可以提高性能的写法是（假设T1表导入newT1表中的数据为10000行）：

  
       openGauss=# INSERT INTO newT1(id, name) SELECT id,name from T1;
openGauss=# SELECT SETVAL('newSeq1',10000);

序列操作函数nextval()，setval() 等均不支持回滚。另外setval设置的新值，会对当前会话的nextval立即生效，但对其他会话，如果定义了cache，不会立即生效，在用尽所有缓存的值后，其变动才被其他会话感知。所以为了避免产生重复值，要谨慎使用setval，设置的新值不能是已经产生的值或者在缓存中的值。

如果必须要在bulkload场景下产生默认序列值，则一定要为newSeq1定义足够大的cache，并且不要定义Maxvalue或者Minvalue。数据库会试图将nextval('sequence_name')的调用下推到Data Node，以提高性能。目前GTM对并发的连接请求是有限制的，当Data Node很多时，将产生大量并发连接，这时一定要控制bulkload的并发数目，避免耗尽GTM的连接资源。如果目标表为复制表(DISTRIBUTE BY REPLICATION)时下推将不能进行。当数据量较大时，这对数据库将是个灾难。除了性能问题之外，空间也可能会剧烈膨胀，在导入结束后，需要用vacuum full来恢复。推荐采用如上建议，不要在bulkload的场景中产生默认序列值。

另外，序列创建后，在每个节点上都维护了一张单行表，存储序列的定义及当前值，但此当前值并非GTM上的当前值，只是保存本节点与GTM交互后的状态。如果其他节点也向GTM申请了新值，或者调用了Setval修改了序列的状态，不会刷新本节点的单行表，但因每次申请序列值是向GTM申请，所以对序列正确性没有影响。

上一篇：云数据库 GAUSSDB-创建和管理定时任务:背景信息

下一篇：云数据库 GAUSSDB-创建和管理序列:操作步骤