云数据库 GaussDB-关于并行导入:导入流程

时间:2023-11-01 16:22:50

导入流程

图3 并行导入流程
表2 流程说明

流程

说明

准备源数据

准备需要导入数据库的源数据文件,并上传至数据服务器。

详细内容请参见准备源数据

启动GDS

在数据服务器上安装配置并启动GDS。

详细内容请参见安装配置和启动GDS

创建外表

创建外表用于识别数据源文件中的数据。外表中保存了数据源文件的位置、文件格式、存放位置、编码格式、数据间的分隔符等信息。

详细内容请参见创建GDS外表

执行导入数据

在创建好外表后,通过INSERT语句,将数据快速、高效地导入到目标表中。详细内容请参见执行导入数据

处理错误表

在数据并行导入发生错误时,请根据具体的错误信息进行处理,以保证导入数据的完整性。

详细内容请参见处理错误表

优化查询效率

导入数据后,通过ANALYZE语句生成表统计信息。ANALYZE语句会将统计结果自动存储在系统表PG_STATISTIC中。执行计划生成器会使用这些统计数据,以生成最有效的查询执行计划。

详细内容请参见分析表

停止GDS

待数据导入完成后,登录每台数据服务器,分别停止GDS。

GDS的停止请参见停止GDS

support.huaweicloud.com/distributed-devg-v2-opengauss/gaussdb-v5r2c10-0191.html