云数据仓库分布式存储

华为云计算云知识云数据仓库分布式存储

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

云数据仓库分布式存储

时间: 2023-05-27 18:21:53

猜你想看：

云服务器备份云服务器活动云数据库境外云服务器 L实例试用服务器

本文由AI智能模型生成，在自有数据的基础上，训练NLP文本生成模型，根据标题生成内容，适配到模板。内容仅供参考，不对其准确性、真实性等作任何形式的保证，如果有任何问题或意见，请联系contentedit@huawei.com或点击右侧用户帮助进行反馈。我们原则上将于收到您的反馈后的5个工作日内做出答复或反馈处理结果。

GaussDB(DWS)采用水平分表的方式，将数据表格的元组按照一定的分布策略分散存储到多个节点。查询的时候可以通过查询条件过滤不必要的数据，快速定位到数据存储位置，从而极大提升数据库性能。

在水平分表的基础上，GaussDB(DWS)支持数据分区（Partition），即根据表的一列或者多列，将要插入表的记录分为不重叠的若干个范围，为每个范围创建一个分区，用来存储相应的数据。

在不同场景下，基于时间分片的方式分区后带来的收益。

当表中访问率较高的行位于一个单独分区或少数几个分区时：大幅减少搜索空间，从而提升访问性能。

当需要查询或更新一个分区的大部分记录时：仅需要连续扫描对应分区，而非扫描整个表，因此可大幅提升性能。

当需要大量加载或者删除的记录位于一个单独分区或少数几个分区时：可直接读取或删除对应分区，从而提升处理性能；同时由于避免大量零散的删除操作，可减少清理碎片工作量。

数据分区带来的好处如下：

改善可管理性

利用分区，可以将表和索引划分为一些更小、更易管理的单元。这样，数据库管理员在进行数据管理时就能采取“分而治之”的方法。有了分区，维护操作可以专门针对表的特定部分执行。

可提升删除操作的性能

删除数据时可以删除整个分区，与分别删除每行相比，这种操作非常高效和快速。

改善查询性能

通过限制要检查或操作的数据数量，分区可带来许多性能优势，包括：

-分区剪枝：

分区剪枝（也称为分区消除）是CN在执行时过滤掉不需要扫描的分区，只对相关的分区进行扫描的技术。分区剪枝通常可以将查询性能提高若干数量级

-智能化分区联接：

通过使用一种称为智能化分区联接的技术，分区还可以改善多表联接的性能。当将两个表联接在一起，并且至少其中一个表使用联接键进行分区时，可以应用智能化分区联接。智能化分区联接将一个大型联接分为多个较小的联接，这些较小的联接包含与联接的表“相同”的数据集。这里，“相同”定义为恰好包含联接的两端中相同的分区键值集，因此可以确保只有这些“相同”数据集的联接才会有效，而不必考虑其他数据集。

云数据仓库分布式存储

对象存储服务（Object Storage Service）是一款稳定、安全、高效、易用的云存储服务，具备标准Restful API接口，可存储任意数量和形式的非结构化数据。

上一篇：表格存储服务位置大数据应用下一篇：实时流计算服务功能描述

免费体验 90+云产品，快速开启云上之旅

相关产品
相关文章

云数据仓库分布式存储

意见反馈

0/200

提交取消

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

对象存储服务 OBS

更多精彩内容

更多内容

7*24

备案

专业服务

退订

建议反馈

售前咨询热线