云数据库 GaussDB-关于并行导入:GDS并发导入
GDS并发导入
- 数据量大,数据存储在多个服务器上时,在每个数据服务器上安装配置、启动GDS后,各服务器上的数据可以并行入库。如图2所示。
GDS进程数目不能超过DN数目。如果超过,会出现一个DN连接多个GDS进程的情形,可能会导致部分GDS异常运行,并有可能出现“Session doesn't exists”报错。若参与某次导入的GDS数量大于DN数量,则在导入执行开始时,会返回“It is recommanded that the number of GDS should not be greater than the number of datanode”的warning。
- 数据存储在一台数据服务器上时,如果 GaussDB 及数据服务器上的I/O资源均还有可利用空间时,可以采用GDS多线程来支持并发导入。
GDS是根据导入事务并发数来决定服务运行线程数的。也就是说即使启动GDS时设置了多线程,也并不会加速单个导入事务。未做过人为事务处理时,一条INSERT语句就是一个导入事务。
综上,多线程的使用场景如下:
- 数据仓库服务GaussDB(DWS)_SQL on Anywhere
- 华为云CodeArts API_接口迁移_接口导入
- GaussDB数据库_gaussdb类型_高斯数据库_华为云
- ModelArts推理部署_OBS导入_模型包规范-华为云
- GaussDB命令_GaussDB数据库命令_高斯数据库命令-华为云
- GaussDB数据库的使用现状_GaussDB最大的优势_高斯数据库的使用现状
- GaussDB架构_GaussDB数据库架构_高斯数据库架构-华为云
- 数据库软件免费版_免费在线数据库_免费的数据库管理软件
- 华为GaussDB自定义函数_GaussDB教程_华为高斯数据库自定义函数
- GaussDB架构_GaussDB分布式形态_高斯数据库架构-华为云