数据仓库 是一种用来存储和分析结构化数据的特殊类型的 数据库 。数据仓库擅长对来自不同来源的数据进行聚合和关联,从而发掘出数据中隐藏的商业价值。在企业的经营决策,商业情报分析等领域都起着至关重要的作用。
随着数据库技术和分布式技术的长足发展,数据仓库也朝着 分布式数据库 的架构演进。目前比较流行的分布式数据仓库架构是MPP(Massive-Parallel Processing)架构。MPP架构特性如下:
MPP架构的数据仓库一般由多个对等的数据计算节点构成。
MPP架构的数据仓库中的数据被按照某种规则近乎均匀地分配到每一个计算节点上。
每个计算节点都独立拥有其计算资源(CPU/内存等)和被分配的数据。
节点之间不存在任何共享的计算资源或数据,因此也被称为无共享(share-nothing)架构系统。
MPP数据仓库为客户的应用提供统一的计算入口,上层应用并不感知数据仓库内部的集群节点规模和数据分片情况,做到了数据分库分表的透明。
MPP架构主要的特点就是查询任务可以在所有的计算节点上被并行地执行,可以更加快速地返回计算的结果。每一个查询任务都会被平均地分配到所有的计算节点上并行地执行,这大大缩短了查询所需要的时间。
MPP架构可以通过简单地增加或减少计算节点数达到改变系统容量的目的,以应付更加灵活的现代企业计算的需要。
基于MPP架构的新一代数据仓库,普遍具有性能出众,兼容性好(针对底层的硬件和上层的应用),扩展性强,成本可控等显著特点,因而近年来越来越受到广大企业用户的青睐。
您可以将PostgreSQL 数据迁移 到GaussDB(DWS)集群。GaussDB(DWS)集群是OLAP场景的数据库,PostgreSQL是OLTP场景的独立数据库。因此,不支持将GaussDB(DWS) 数据库迁移 到PostgreSQL。