检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
不推荐以下分布键选择方式: 分布列用默认值(第一列)。 分布列用sequence自增生成。 分布列用随机数生成(除非任意列,或者任意两列的组合做分布键都是倾斜的,一般不选用这种方法)。 父主题: 集群性能
groupname | NODE ( nodename [, ... ] ) } TO GROUP目前不支持使用。TO NODE主要供内部扩容工具使用,一般用户不应使用。 示例 创建名称为server_remote的外部服务器,对应的foreign data wrapper为GC_FDW。 1
groupname | NODE ( nodename [, ... ] ) } TO GROUP目前不支持使用。TO NODE主要供内部扩容工具使用,一般用户不应使用。 示例 创建名称为server_remote的外部服务器,对应的foreign data wrapper为GC_FDW。 1
在线扩容 在集群扩容过程中,支持数据持续入库。 商用 扩容集群 3 敏感操作保护 支持敏感操作保护功能,当用户在控制台进行敏感操作时,则需要输入证明身份的凭证,身份验证通过后方可进行相关操作。为了帐号安全,建议开启操作保护功能,该功能对帐号以及帐号下的子用户都生效。 商用 敏感操作保护
文件可能很多,执行analyze可能会很慢,通过“totalrows”参数,让用户来设置一个预估的值,使优化器能通过这个值做大小表的估计。一般预估值与实际值的数量级差不多时,查询效率较高。 “encoding”:外表中数据源文件的编码格式名称,缺省为utf8。对于OBS外表此参数为必选项。
WHERE a.xc_node_id=b.node_id ORDER BY a.count desc; 其中xc_node_id对应DN,一般来说,不同DN的数据量相差5%以上即可视为倾斜,如果相差10%以上就必须要调整分布列。GaussDB(DWS)支持多分布列特性,可以更好地满足数据分布的均匀性要求。
行存索引按照30%评估。 EVS磁盘空间推荐:如果按以上算法估算,实际操作比较麻烦,建议:EVS磁盘空间总大小设置为压缩后的总数据量大小(压缩比一般按5倍计算),如果表上没有索引(EVS主要做缓存使用),EVS磁盘空间总大小可以设置为总数据量(可以排除掉归档数据的大小)大小的50%或者
“off”。 字段分隔符(delimiter)为“,”。 header(指定导出数据文件是否包含标题行) 指定导出数据文件是否包含标题行,标题行一般用来描述表中每个字段的信息。 OBS导出数据时不支持该参数为true,使用缺省值false,不需要设置,表示导出的数据文件第一行不是标题行(即表头)。
版本放在了一起。GaussDB(DWS)没有回滚段的概念,但是为了定期清除历史版本数据GaussDB(DWS)引入了一个VACUUM进程。一般情况下用户不用关注它,除非要做性能调优。此外,GaussDB(DWS)是自动提交事务。
传统的数据比如MySQL数据库等,支持通过Binlog来记录数据库中所有数据的变化,但相比于MySQL的Binlog主要用于数据恢复与主从复制,DWS实时数仓Binlog一般只用于实时场景下的数据同步。同时DWS实时数仓Binlog并不会记录DDL操作,只记录Insert/Delete/Update/(Upsert)等DML操作。
ROW,表示表的数据将以行方式存储。 默认值:ROW。 COMPRESSION 指定表数据的压缩级别,它决定了表数据的压缩比以及压缩时间。一般来讲,压缩级别越高,压缩比越大,压缩时间也越长;反之亦然。实际压缩比取决于加载的表数据的分布特征。 取值范围: HStore表和列存表的有
对于Hash分布策略,如果分布列选择不当,可能导致数据倾斜。因此在采用Hash分布策略之后会对用户表的数据进行数据倾斜性检查,以确保数据在各个DN上是均匀分布的。一般情况下分布列都是选择键值重复度小,数据分布比较均匀的列。 操作步骤 分析数据源特征,选择若干个键值重复度小,数据分布比较均匀的备选分布列。
ROW,表示表的数据将以行方式存储。 默认值:ROW。 COMPRESSION 指定表数据的压缩级别,它决定了表数据的压缩比以及压缩时间。一般来讲,压缩级别越高,压缩比也越大,压缩时间也越长;反之亦然。实际压缩比取决于加载的表数据的分布特征。 取值范围: HStore表和列存表的
缺省值: CSV格式下默认值是一个没有引号的空字符串。 在TEXT格式下默认值是\N。 HEADER 指定导出数据文件是否包含标题行,标题行一般用来描述表中每个字段的信息。header只能用于CSV,FIXED格式的文件中。 在导入数据时,如果header选项为on,则数据文件中第
分区个数发生变化(ERRCODE_PARTITION_NUM_CHANGED) 45003 在扫描LIST分区表时,发现此时的分区个数和优化阶段的分区个数不一致,一般出现在查询和ADD/DROP分区并发时。(此错误类型仅8.1.3及以上集群版本支持) 开启CN Retry功能需要设置如下GUC参数: 必选的GUC参数(CN和DN都需设置)
长度不足的字段以空格填充,数字类型字段左对齐,字符字段右对齐。 字段和字段之间没有分隔符。 header 指定导出数据文件是否包含标题行,标题行一般用来描述表中每个字段的信息。header只能用于CSV,FIXED格式的文件中。 在导入数据时,如果header选项为on,则数据文件中第
缺省值: CSV格式下默认值是一个没有引号的空字符串。 在TEXT格式下默认值是\N。 HEADER 指定导出数据文件是否包含标题行,标题行一般用来描述表中每个字段的信息。header只能用于CSV,FIXED格式的文件中。 在导入数据时,如果header选项为on,则数据文件中第
默认值: CSV格式下默认值是一个没有引号的空字符串。 在TEXT格式下默认值是\N。 header 指定导出数据文件是否包含标题行,标题行一般用来描述表中每个字段的信息。header只能用于CSV,FIXED格式的文件中。 在导入数据时,如果header选项为on,则数据文本第一
分区个数发生变化(ERRCODE_PARTITION_NUM_CHANGED) 45003 在扫描LIST分区表时,发现此时的分区个数和优化阶段的分区个数不一致,一般出现在查询和ADD/DROP分区并发时。(此错误类型仅8.1.3及以上集群版本支持) 节点间对象SCHEMA名称不一致(ERRCODE_U
缺省值: CSV格式下默认值是一个没有引号的空字符串。 在TEXT格式下默认值是\N。 HEADER 指定导出数据文件是否包含标题行,标题行一般用来描述表中每个字段的信息。header只能用于CSV,FIXED格式的文件中。 在导入数据时,如果header选项为on,则数据文件中第