云数据库 GAUSSDB-创建和管理序列:注意事项
注意事项
新序列值的产生是靠GTM维护的,默认情况下,每申请一个序列值都要向GTM发送一次申请,GTM在当前值的基础上加上步长值作为产生的新值返回给调用者。GTM作为全局唯一的节点,势必成为性能的瓶颈,所以对于需要大量频繁产生序列号的操作,如使用Bulkload工具进行数据导入场景,是非常不推荐产生默认序列值的。比如,在下面所示的场景中, INSERT FROM SELECT语句的性能会非常慢。
1 2 3 4 5 6 7 |
openGauss=# CREATE SEQUENCE newSeq1; openGauss=# CREATE TABLE newT1 ( id int not null default nextval('newSeq1'), name text ); openGauss=# INSERT INTO newT1(name) SELECT name from T1; |
可以提高性能的写法是(假设T1表导入newT1表中的数据为10000行):
1 2 |
openGauss=# INSERT INTO newT1(id, name) SELECT id,name from T1; openGauss=# SELECT SETVAL('newSeq1',10000); |
序列操作函数nextval(),setval() 等均不支持回滚。另外setval设置的新值,会对当前会话的nextval立即生效,但对其他会话,如果定义了cache,不会立即生效,在用尽所有缓存的值后,其变动才被其他会话感知。所以为了避免产生重复值,要谨慎使用setval,设置的新值不能是已经产生的值或者在缓存中的值。
如果必须要在bulkload场景下产生默认序列值,则一定要为newSeq1定义足够大的cache,并且不要定义Maxvalue或者Minvalue。数据库会试图将nextval('sequence_name')的调用下推到Data Node,以提高性能。 目前GTM对并发的连接请求是有限制的,当Data Node很多时,将产生大量并发连接, 这时一定要控制bulkload的并发数目,避免耗尽GTM的连接资源。如果目标表为复制表(DISTRIBUTE BY REPLICATION)时下推将不能进行。当数据量较大时,这对数据库将是个灾难。除了性能问题之外,空间也可能会剧烈膨胀,在导入结束后,需要用vacuum full来恢复。推荐采用如上建议,不要在bulkload的场景中产生默认序列值。
另外,序列创建后,在每个节点上都维护了一张单行表,存储序列的定义及当前值,但此当前值并非GTM上的当前值,只是保存本节点与GTM交互后的状态。如果其他节点也向GTM申请了新值,或者调用了Setval修改了序列的状态,不会刷新本节点的单行表,但因每次申请序列值是向GTM申请,所以对序列正确性没有影响。
- GaussDB数据库入门_华为高斯数据库_新建高斯数据库_高斯语法_高斯数据库协议
- gaussdb咋样_gaussdb介绍_gaussdb的优势_gaussdb用法_gaussdb架构
- GaussDB数据库产品特性_华为gaussdb_高斯语法
- GaussDB基础概念_华为gaussdb_gaussdb数据库_gaussdb学习_高斯gaussdb
- GaussDB登录_GaussDB数据库登录_高斯数据库登录-华为云
- GaussDB性能怎么调_华为gaussdb_gaussdb性能_gaussdb学习
- GaussDB性能_Gaussdb数据库性能_高斯数据库性能-华为云
- GaussDB学习_gaussdb教程_高斯数据库学习_华为云
- GaussDB数据库用法_GaussDB基于_高斯数据库用法
- GaussDB数据库的使用现状_GaussDB最大的优势_高斯数据库的使用现状