Importación y exportación de datos de GaussDB(DWS)
GaussDB(DWS) proporciona una gama de soluciones que permiten importar y exportar datos en múltiples formatos.
Herramientas de importación y exportación
Puede elegir entre las siguientes herramientas según sea necesario para importar datos a GaussDB(DWS) o exportarlos desde GaussDB(DWS).
Tabla 3-1 Herramientas de importación y exportación de datos
Uso
|
Herramienta
|
---|---|
Importación o exportación por lotes de una gran cantidad de datos |
GDS |
Importación o exportación por lotes de una pequeña cantidad de datos |
copiar en/desde (archivo/Stdin) |
Exportación del conjunto de resultados de la consulta |
copiar consulta en/desde (archivo/Stdin) |
Importar una pequeña cantidad de datos a otras bases de datos o exportar dicha cantidad a otras bases de datos |
insertar valores / ETL |
Respaldo/restauración de metadatos de base de datos |
gs_dump/gs_restore |
Importación de datos desde HDFS |
Tabla externa HDFS |
Importación de datos desde OBS |
Tabla externa de texto de OBS, tabla externa ORC de OBS |
Migración / copia de seguridad de datos entre clústeres |
Roach |
Servicio de datos de Gauss (GDS)
Puede utilizar la herramienta de servicio de datos Gauss (GDS) para importar y exportar texto de manera eficiente.
Como se muestra en la siguiente figura, se emplea un servidor GDS en cada nodo físico de un clúster para importar y exportar datos en paralelo. La velocidad de un solo nodo puede alcanzar los 700 MBps.
Figura 3-1 Importación y exportación de datos en paralelo mediante GDS
GDS puede trabajar conjuntamente con Foreign Data Wrapper (FDW), que permite el acceso a los datos de distintos clústeres, para migrar datos de un clúster a otro de forma rápida y sencilla. Como se muestra en la siguiente figura, GDS establece un canal de transferencia de datos entre dos clústeres. Los datos pueden exportarse desde el clúster de origen e importarse directamente al clúster de destino sin escribirse en discos.
Figura 3-2 Migración de datos entre clústeres
Ventajas
- Facilidad de uso. Puede migrar los datos ejecutando una sola sentencia SQL: “INSERT INTO... SELECT... FROM... [WHERE];”.
- Alto rendimiento: La potencia informática de ambos clústeres se puede utilizar completamente.
- Los datos no se escriben en los discos durante la migración, por lo que no ocupan espacio en disco.
Uso
- Migración de datos completa entre los clústeres de GaussDB(DWS).
- Migración parcial de datos basada en condiciones de filtrado entre clústeres de GaussDB(DWS).