检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为什么要使用云数据仓库服务GaussDB(DWS) ? 现状和需求 大量的企业经营性数据(订单,库存,原料,付款等)在企业的业务运营系统以及其后台的(事务型)数据库中产生的。 企业的决策者需要及时地对这些数据进行归类分析,从中获得企业运营的各种业务特征,为下一步的经营决策提供数据支撑。
table_distribution('public','store_sales'); 通过资源监控发现,个别节点的CPU和I/O明显比其他节点高。 处理方法 如何找到倾斜的表: 数据库中表个数少于1W的场景下,可直接使用倾斜视图查询当前库内所有表的数据倾斜情况。 1 SELECT * FROM pg
开发人员选项 enable_light_colupdate 参数说明:控制是否使用列存轻量化UPDATE。 参数类型:USERSET 取值范围:布尔型 on表示开启列存轻量化UPDATE。 off表示关闭列存轻量化UPDATE。 默认值:off 列存轻量化UPDATE与后台列存A
将继承对应函数和操作符所调用结果集的排序规则。 表达式的排序规则派生可以是显式或隐式。该区别会影响多个不同的排序规则出现在同一个表达式中时如何对collation进行组合。当执行语句使用COLLATE子句时,将发生显式派生,否则为隐式派生。当多个排序规则组合时,规则如下: 如果输
将继承对应函数和操作符所调用结果集的排序规则。 表达式的排序规则派生可以是显式或隐式。该区别会影响多个不同的排序规则出现在同一个表达式中时如何对collation进行组合。当执行语句使用COLLATE子句时,将发生显式派生,否则为隐式派生。当多个排序规则组合时,规则如下: 如果输
SMP并行执行 在复杂查询场景中,单个查询的执行较长,系统并发度低,通过SMP并行执行技术实现算子级的并行,能够有效减少查询执行时间,提升查询性能及资源利用率。 通过算子并行来提升性能,同时会占用更多的系统资源,包括CPU、内存、网络、I/O等等。本质上SMP是一种以资源换取时间
SMP并行执行 在复杂查询场景中,单个查询的执行较长,系统并发度低,通过SMP并行执行技术实现算子级的并行,能够有效减少查询执行时间,提升查询性能及资源利用率。 通过算子并行来提升性能,同时会占用更多的系统资源,包括CPU、内存、网络、I/O等等。本质上SMP是一种以资源换取时间
弹性变更规格 概述 在使用集群过程中,当用户的业务量过大,则需要更多的资源(CPU、内存、磁盘等)来支撑庞大的业务量,如果用户当前使用的集群资源不足,则需要新建集群,或将当前集群删除后创建一个资源更多的集群,这样不仅消耗成本,整个流程也会十分耗时。而且如果用户创建的集群自身资源较
数据仓库类型 产品类型概述 存算一体:面向数据分析场景,为用户提供高性能、高扩展、高可靠、高安全、低时延、易运维的企业级数仓服务,支持2048节点、20PB级超大规模数据分析能力,适用于“库、仓、市、湖”一体化的融合分析业务。 存算分离:采用存算分离云原生架构,计算、存储分层弹性
可以选择不做限制,也可以根据所能容忍的错误数量选择一个上限值。 compatible_illegal_chars:导入时遇到非法字符,选择如何处理。是将非法字符按照转换规则转换后入库,还是报错中止导入。 取值范围:true/on,false/off。 参数为true/on,则导入
8.2.1版本新增功能 8.2.1.x版本(仅限白名单用户发布)新增功能参见8.2.1版本新增功能,各补丁解决问题列表参见8.2.1.x补丁新增功能及解决问题。 【V8.2.1.230版本发布时间】2024年10月 【V8.2.1.225版本发布时间】2024年7月 【V8.2.1
定关键字NOCOMPRESS则不对表进行压缩。 缺省值:NOCOMPRESS,即不对元组数据进行压缩。 DISTRIBUTE BY 指定表如何在节点之间分布或者复制。 取值范围: REPLICATION:表的每一行存在所有数据节点(DN)中,即每个数据节点都有完整的表数据。 RO
GaussDB(DWS)查询时结果不一致的常见场景和解决方法 GaussDB(DWS)中使用SQL语句查询时会出现同一条查询语句返回结果不一致的问题,此类问题大部分都是由于语法使用不当或用法不合理导致,通过合理的业务使用可以避免此类问题。以下列举了几种常见的查询结果不一致的场景和对应的解决办法供参考:
2.0:列存表的每列合并存储在一个文件中,文件名以relfilenode.C1.0命名。 默认值:2.0 DISTRIBUTE BY 指定表如何在节点之间分布或者复制。 取值范围: HASH (column_name ) :对指定的列进行Hash,通过映射,把数据分布到指定DN。 TO
INSERT INSERT插入形式包括:HIGH_PRIORITY、LOW_PRIORITY、PARTITION、DELAYED、IGNORE、VALUES以及ON DUPLICATE KEY UPDATE。 HIGH_PRIORITY MySQL中如果指定HIGH_PRIORI
create_table_fir.sql 如示例中涉及的以下信息可根据实际情况替换: postgres:所要连接的数据库名称。 10.10.0.1:集群连接地址。 dbadmin:集群数据库的用户名。默认管理员用户为“dbadmin”。 8000:创建集群时设置的“数据库端口”。 password:创建集群时设置的密码。
定关键字NOCOMPRESS则不对表进行压缩。 缺省值:NOCOMPRESS,即不对元组数据进行压缩。 DISTRIBUTE BY 指定表如何在节点之间分布或者复制。 取值范围: REPLICATION:表的每一行存在所有数据节点(DN)中,即每个数据节点都有完整的表数据。 RO
离线扩容期间集群将变为只读状态,请谨慎操作。 扩容期间集群会有闪断,请谨慎操作。 为保证用户的数据安全建议在开始扩容操作之前创建手动快照。如何创建快照请参见手动快照。 在单击“确认”时会触发检查项的检查,若不通过会弹窗提示,用户按提示解决后可重试,详情请参见扩容检查不通过怎么办?。
t_tablespace为空,将使用数据库的缺省表空间。该参数仅9.1.0.200及以上集群版本支持。 DISTRIBUTE BY 指定表如何在节点之间分布或者复制。 取值范围: REPLICATION:表的每一行存在所有数据节点(DN)中,即每个数据节点都有完整的表数据。 RO
gs_dump 背景信息 gs_dump是GaussDB(DWS)用于导出数据库相关信息的工具,用户可以自定义导出一个数据库或其中的对象(模式、表、视图等)。支持导出的数据库可以是默认数据库postgres,也可以是自定义数据库。 gs_dump工具在进行数据导出时,其他用户可以访问集群数据库(读或写)。