数据仓库服务 GAUSSDB(DWS)-数据分布式存储
数据分布式存储
DWS采用水平分表的方式,将业务数据表的元组分散存储到各个节点内,该优势在于,查询中通过查询条件过滤不必要的数据,快速定位到数据存储位置,可极大提升数据库性能。
水平分表方式将一个数据表内的数据,按合适分布策略分散存储在多个节点内,DWS支持如表1所示的数据分布策略。用户可在CREATE TABLE时增加DISTRIBUTE BY参数,对指定的表应用数据分布功能。
策略 |
描述 |
适用场景 |
优势与劣势 |
---|---|---|---|
复制表(Replication) |
集群中每一个DN实例上都有一份全量表数据。 |
小表、维度表。 |
|
哈希表(Hash) |
表数据通过hash方式散列到集群中的所有DN实例上。 |
数据量较大的事实表。 |
|
轮询表(Roundrobin) 8.1.2及以上版本支持 |
表的每一行被轮番地发送给各个DN,数据会被均匀地分布在各个DN中。 |
数据量较大的事实表,且使用Hash分布时找不到合适的分布列。 |
|
- 数据仓库服务GaussDB(DWS)_SQL on Anywhere
- DWS安全_数据仓库服务安全_DWS数据安全管理_DWS安全保障_DWS安全策略
- 调用GaussDB(DWS) API接口_数据仓库服务调用API_如何调用API_在DWS中调用API
- 分布式存储是什么_数据库分布式存储_分布式存储介绍
- DWS产品介绍_DWS产品优势_DWS功能_DWS使用场景_DWS是什么
- GaussDB(DWS)常用SQL_常用SQL命令_SQL语法
- DWS资源管理_GaussDB(DWS)资源管理作用_DWS资源管控
- 如何进行日志采集和转储_日志平台_日志接入_日志转储
- GaussDB(DWS)服务_什么是IoT数仓_如何使用IoT数仓
- GAUSS(DWS)工具_gsql工具_DataStudio工具_DSC工具