搜索_华为云

重分布 - 数据仓库服务 GaussDB(DWS)

容时关闭自动重分布功能，在扩容成功之后再手动使用重分布功能执行重分布任务，在这种分段模式下，扩容和重分布都可以做到失败重试。当前重分布支持离线重分布和在线重分布两种模式，默认情况下，提交重分布任务时将选择离线重分布模式。在重分布开始前或重分布暂停过程中，支持对未重分布的表按照schema、表维度设置重分布优先级。

帮助中心 > 数据仓库服务 GaussDB(DWS) > 用户指南 > GaussDB(DWS)集群运维 > GaussDB(DWS)集群节点扩缩容 > 节点变更 > 集群重分布
查看重分布详情 - 数据仓库服务 GaussDB(DWS)

重分布中会显示重分布状态、重分布配置、重分布整体进度以及指定数据库下所有数据库表的重分布详情。用户在查看数据表重分布详情时，必须指定一个数据库，且支持按照表的重分布状态和表名作为条件的搜索，由于重分布机制的原因，若某数据库下所有表完成重分布，页面将不会再查询到详细信息。重分布暂停状

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 用户指南 > GaussDB(DWS)集群运维 > GaussDB(DWS)集群节点扩缩容 > 节点变更 > 集群重分布
GaussDB(DWS)热数据存储和冷数据存储的区别？ - 数据仓库服务 GaussDB(DWS)

GaussDB(DWS)热数据存储和冷数据存储的区别？热数据存储和冷数据存储最大的区别在于存储介质不同：热数据存储是直接将频繁被查询或更新，对访问的响应时间要求很高的热数据存储在DN数据盘中。冷数据存储将不更新，偶尔被查询，对访问的响应时间要求不高的冷数据存储在OBS中。因为其存储介质的不

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 常见问题 > 集群管理
分布式执行框架 - 数据仓库服务 GaussDB(DWS)

分布式执行框架 GS_235100005 错误码： Stream plan check failed. Execution datanodes list of stream node[%d] mismatch in parent node[%d]. 解决方案：请使用INTERNAL

帮助中心 > 数据仓库服务 GaussDB(DWS) > 8.2.1及以上版本 > 执行器
查询专属分布式存储池列表 - 数据仓库服务 GaussDB(DWS)

objects 专属分布式存储池列表对象。 count Integer 专属分布式存储池数量。表3 DssPool 参数参数类型描述 id String 专属分布式存储池ID。 name String 专属分布式存储池名称。 type String 专属分布式存储池的存储类型。 SSD：超高IO专属分布式存储池。

帮助中心 > 数据仓库服务 GaussDB(DWS) > API参考 > API说明 > 集群管理
如何调整GaussDB(DWS)分布列？ - 数据仓库服务 GaussDB(DWS)

如何调整GaussDB(DWS)分布列？在数据仓库类型的数据库中，大表的分布列选择对于数据库和语句查询性能都有至关重要的影响。如果表的分布列选择不当，在数据导入后有可能出现数据分布倾斜，进而导致某些磁盘的使用明显高于其他磁盘，极端情况下会导致集群只读。对于Hash分表策略，存在数据倾斜情况下，查询时出

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 常见问题 > 数据库使用
TABLESPACE对象设计规范 - 数据仓库服务 GaussDB(DWS)

TABLESPACE对象设计规范规则2.8 禁止自定义TABLESPACE表空间违反规则的影响：分布式场景建表使用自定义表空间，导致表数据无法按照各DN分布式存储，出现存储倾斜。方案建议：创建表对象使用内置默认表空间。父主题： GaussDB(DWS)对象设计规范

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 标准数仓开发指南(8.1.3.x) > GaussDB(DWS)开发设计规范 > GaussDB(DWS)对象设计规范
步骤3：调优表操作具体步骤 - 数据仓库服务 GaussDB(DWS)

步骤3：调优表操作具体步骤选择存储方式此实践中所使用的样例表为典型的TPC-DS表，是典型的多字段表，统计分析类查询场景多，因此选择列存存储方式。 1 WITH (ORIENTATION = column) 选择压缩级别在步骤1：创建初始表并加装样例数据中没有指定压缩比，Gaus

帮助中心 > 数据仓库服务 GaussDB(DWS) > 最佳实践 > 性能调优 > 基于表结构设计和调优提升GaussDB(DWS)查询性能
如果GaussDB(DWS)建表时没有指定分布列，数据会怎么存储？ - 数据仓库服务 GaussDB(DWS)

如果GaussDB(DWS)建表时没有指定分布列，数据会怎么存储？ 8.1.2及以上集群版本，可通过GUC参数default_distribution_mode来查询和设置表的默认分布方式。如果建表时没有指定分布列，数据会以下几种场景来存储：场景一若建表时包含主键/唯一约束，则选

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 常见问题 > 数据库使用
TABLE对象设计规范（重点） - 数据仓库服务 GaussDB(DWS)

优点：每个DN上都有此表的全量数据，JOIN操作中可以完全避免节点间数据通信，从而减小网络开销，同时减少了STREAM线程启停开销。缺点：每个DN都保留了表的完整数据，数据的冗余，占用更多存储空间。小表、维度表。规则2.10 创建表时必须选择正确的存储方式违反规范的影响：行

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 标准数仓开发指南(8.1.3.x) > GaussDB(DWS)开发设计规范 > GaussDB(DWS)对象设计规范
数据脱敏 - 数据仓库服务 GaussDB(DWS)

数据脱敏 GaussDB(DWS)提供列级别的数据脱敏(Dynamic Data Masking)功能。针对某些敏感信息（如身份证号、手机号、银行卡号等），通过应用脱敏函数进行原始数据的变形改写，实现敏感隐私数据的可靠保护，从而增强产品在数据安全和隐私保护方面的能力。了解更多请参见数据脱敏。

帮助中心 > 数据仓库服务 GaussDB(DWS) > 产品介绍 > 安全 > 数据保护技术
TABLESPACE对象设计规范 - 数据仓库服务 GaussDB(DWS)

TABLESPACE对象设计规范规则2.8 禁止自定义TABLESPACE表空间违反规则的影响：分布式场景建表使用自定义表空间，导致表数据无法按照各DN分布式存储，出现存储倾斜。方案建议：创建表对象使用内置默认表空间。父主题： GaussDB(DWS)对象设计规范

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 标准数仓开发指南(9.1.0.x) > GaussDB(DWS)开发设计建议 > GaussDB(DWS)对象设计规范
为什么GaussDB(DWS)扩容后已使用存储容量比扩容前减少了很多？ - 数据仓库服务 GaussDB(DWS)

成后，原节点存储的业务数据明显多于新节点，此时系统自动在所有节点重新分布保存数据。在开始做重分布时，系统会自动执行一次vacuum，从而释放了存储空间，因此，扩容后已使用存储容量减少了很多。处理方法建议您定期做vacuum full清理与回收存储空间，防止数据膨胀。如果执行

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 常见问题 > 集群管理
GaussDB(DWS)可以存储多少业务数据？ - 数据仓库服务 GaussDB(DWS)

为增强可靠性，每个节点都有一个副本，副本会占用一半的存储空间，选择容量时副本容量会自动翻倍存储。数据仓库系统会备份数据，生成索引、临时缓存文件、运行日志等内容，并占用存储容量。每个节点实际存储的数据，大致为总存储容量的一半。父主题：数据迁移

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 常见问题 > 数据迁移
TABLE对象设计规范（重点） - 数据仓库服务 GaussDB(DWS)

优点：每个DN上都有此表的全量数据，JOIN操作中可以完全避免节点间数据通信，从而减小网络开销，同时减少了STREAM线程启停开销。缺点：每个DN都保留了表的完整数据，数据的冗余，占用更多存储空间。小表、维度表。规则2.10 创建表时必须选择正确的存储方式违反规范的影响：行

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 标准数仓开发指南(9.1.0.x) > GaussDB(DWS)开发设计建议 > GaussDB(DWS)对象设计规范
GaussDB(DWS)表设计规则 - 数据仓库服务 GaussDB(DWS)

GaussDB(DWS)是分布式架构。数据分布在各个DN上。总体上讲，良好的表设计需要遵循以下原则：【关注】将表数据均匀分布在各个DN上。数据均匀分布，可以防止数据在部分DN上集中分布，从而导致因存储倾斜造成集群有效容量下降。通过选择合适的分布列，可以避免数据倾斜。【关注】将表的

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 标准数仓开发指南(8.1.3.x) > GaussDB(DWS)开发设计规范 > GaussDB(DWS)各对象设计详细规则 > GaussDB(DWS)数据库对象设计规则
GaussDB(DWS)中单表查询性能与哪些因素有关？ - 数据仓库服务 GaussDB(DWS)

分布列选择不当，在数据导入后有可能出现数据分布倾斜，进而导致某些磁盘的使用明显高于其他磁盘，极端情况下会导致集群只读。合理的选择分布键，对表查询的性能至关重要。此外，合适的分布键还可以使数据的索引更快地创建和维护。单表存储数据量单表存储的数据量越大，查询性能就越差。当表中的数据量很大时

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 常见问题 > 数据库性能
PGXC - 数据仓库服务 GaussDB(DWS)
PGXC - 数据仓库服务 GaussDB(DWS)

PGXC_DEADLOCK PGXC_DEADLOCK视图获取导致分布式死锁产生的锁等待信息。目前，PGXC_DEADLOCK视图只收集locktype为relation、partition、page、tuple和transactionid的锁等待信息。表1 PGXC_DEADLOCK字段

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 标准数仓开发指南(8.1.3.x) > GaussDB(DWS)系统表和系统视图 > 系统视图
使用DLI Flink作业实时同步Kafka数据至(GaussDB)DWS集群 - 数据仓库服务 GaussDB(DWS)

Flink作业实时同步Kafka数据至(GaussDB)DWS集群本实践演示通过数据湖探索服务 DLI Flink作业将分布式消息服务 Kafka的消费数据实时同步至GaussDB(DWS)数据仓库，实现Kafka实时入库到GaussDB(DWS)的过程。演示过程包括实时写入和更新已有数据的场景。了解DLI请参见数据湖产品介绍。

帮助中心 > 数据仓库服务 GaussDB(DWS) > 最佳实践 > 数据迁移
成长地图 - 数据仓库服务 GaussDB(DWS)

演示如何创建DWS集群，连接示例数据库、导入存储在OBS中的示例数据和查询分析数据的流程，帮助您快速使用DWS。快速入门创建集群并导入OBS数据数据库使用入门 TPC-DS和TPC-H测试在线课堂一节课入门及动手实践数据仓库介绍性能调优介绍高级特性数据库集群管理 SQL进阶

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 成长地图

总条数： 3771

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

重分布 - 数据仓库服务 GaussDB(DWS)

查看重分布详情 - 数据仓库服务 GaussDB(DWS)

GaussDB(DWS)热数据存储和冷数据存储的区别？ - 数据仓库服务 GaussDB(DWS)

分布式执行框架 - 数据仓库服务 GaussDB(DWS)

查询专属分布式存储池列表 - 数据仓库服务 GaussDB(DWS)

如何调整GaussDB(DWS)分布列？ - 数据仓库服务 GaussDB(DWS)

TABLESPACE对象设计规范 - 数据仓库服务 GaussDB(DWS)

步骤3：调优表操作具体步骤 - 数据仓库服务 GaussDB(DWS)

如果GaussDB(DWS)建表时没有指定分布列，数据会怎么存储？ - 数据仓库服务 GaussDB(DWS)

TABLE对象设计规范（重点） - 数据仓库服务 GaussDB(DWS)

数据脱敏 - 数据仓库服务 GaussDB(DWS)

TABLESPACE对象设计规范 - 数据仓库服务 GaussDB(DWS)

为什么GaussDB(DWS)扩容后已使用存储容量比扩容前减少了很多？ - 数据仓库服务 GaussDB(DWS)

GaussDB(DWS)可以存储多少业务数据？ - 数据仓库服务 GaussDB(DWS)

TABLE对象设计规范（重点） - 数据仓库服务 GaussDB(DWS)

GaussDB(DWS)表设计规则 - 数据仓库服务 GaussDB(DWS)

GaussDB(DWS)中单表查询性能与哪些因素有关？ - 数据仓库服务 GaussDB(DWS)

PGXC - 数据仓库服务 GaussDB(DWS)

使用DLI Flink作业实时同步Kafka数据至(GaussDB)DWS集群 - 数据仓库服务 GaussDB(DWS)

成长地图 - 数据仓库服务 GaussDB(DWS)

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线