GaussDB(DWS)与Hive在功能上存在一定的差异,主要体现在以下几个方面:
Hive是基于Hadoop MapReduce的 数据仓库 ,GaussDB(DWS)是基于Postgres的MPP的数据仓库。
Hive的数据在HDFS中存储,GaussDB(DWS)的数据可以在本地存储,也可以通过外表的形式通过OBS进行存储。
Hive不支持索引,GaussDB(DWS)支持索引,所以查询速度GaussDB(DWS)更快。
Hive不支持存储过程,GaussDB(DWS)支持存储过程,使用场景更广泛。
GaussDB(DWS)比Hive对SQL的支持更丰富,包括函数、自定义函数、存储过程。
Hive不支持事务,GaussDB(DWS)支持完整事务。
在数据可靠性方面,Hive和GaussDB(DWS)均支持副本,可靠性基本一致。
在性能上,GaussDB(DWS)极大地优于Hive。
GaussDB(DWS)和Hive基于各自的功能特点,在应用场景上,Hive仅用于离线分析场景,GaussDB(DWS)适用于在线分析场景及AD-Hoc(即席查询)场景。