检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
可能已经在同一个存储页里了,这样便节省了磁盘访问的时间,加速了查询。 在聚簇过程中,系统先创建一个按照索引顺序建立的表的临时拷贝,同时也建立表上的每个索引的临时拷贝。因此,需要磁盘上有足够的剩余空间, 至少是表大小和索引大小的和。 由于CLUSTER会记忆聚集信息,可以在第一次的
匀地分布在各个DN中。对于数据量比较大的表,如果Hash分布找不到一个合适的分布列,建议采用Roundrobin分布策略。 对于Hash分布策略,如果分布列选择不当,可能导致数据倾斜。因此在采用Hash分布策略之后会对用户表的数据进行数据倾斜性检查,以确保数据在各个DN上是均匀分
业运行内存空间不足,导致作业不稳定,因此需要对查询语句的作业内存使用进行限制,保证作业运行的稳定性。 假如作业想要使用500M内存,但实际上因为内存限制最终只分配到300M内存,则需要把临时不用的数据写到磁盘上,内存中只保留正在使用的数据,这就是中间数据落盘的由来。当发生中间数据
t1.b=t2.b,可以在t1表上的a,b字段上建立组合索引。 where子句的过滤条件字段上(尤其是范围条件)。 在经常出现在order by、group by和distinct后的字段。 对于点查询场景,推荐建立btree索引。 在分区表上创建索引与在普通表上创建索引的语法不太一
设置Java内存分配:用户配置工具在迁移过程中可使用的内存资源,超出设置的内存,工具将显示错误消息并退出。 设置application.properties application.properties文件中包括一系列应用配置参数,用于控制DSC在迁移数据库脚本时的行为,该文件中的
所帮助,因为如果索引标识出第一匹配行所在的存储页,所有其它行也可能已经在同一个存储页里了,这样便节省了磁盘访问的时间,加速了查询。 在聚簇过程中,系统创建一个按照索引顺序建立的表的临时复制的同时,也会建立表上的每个索引的临时复制。因此,需要磁盘上有足够的剩余空间, 至少是表大小和索引大小的和。
错误处理 数据导入过程中,对于如下错误信息,表示GaussDB(DWS)期望读取ORC数据文件,但实际却是*.txt类型的数据文件。请先参见在MRS集群上创建Hive ORC表创建Hive ORC类型的表,并将数据存储到该Hive ORC表中。 ERROR: dn_6009_6010:
loading data to partitioned DFS table" SQLSTATE: 08000 错误原因:HDFS分区表导入数据时在创建分区目录失败。 解决办法:在对应DN日志中查找具体原因信息,很多情况是由于用户权限不够。 GAUSS-04714: "Error occurs
varying(64) 列名。 data_type character varying(128) 列的数据类型。 column_id integer 对象创建或增加列时列的序号。 data_length integer 列的字节长度。 avg_col_len numeric 列的平均长度,单位为字节。
PG_REDACTION_COLUMN系统表存储脱敏列的信息。 表1 PG_REDACTION_COLUMN字段 名称 类型 描述 object_oid oid 脱敏对象OID。 column_attrno smallint 脱敏列attrno。 function_type integer 脱敏类型。 说明:
varying(64) 列名。 data_type character varying(128) 列的数据类型。 column_id integer 对象创建或增加列时列的序号。 data_length integer 列的字节长度。 avg_col_len numeric 列的平均长度,单位字节。
varying(64) 列名。 data_type character varying(128) 列的数据类型。 column_id integer 对象创建或增加列时列的序号。 data_length integer 列的字节长度。 avg_col_len numeric 列的平均长度(单位字节)。
DISTRIBUTE BY HASH (r_reason_sk); 在执行数据导入前,先删除相关表的索引。 假定在导入表“reasons”上的“r_reason_id”字段上存在普通索引“reasons_idx”。在执行数据导入前,请先删除相关索引。 1 DROP INDEX reasons_idx;
1 python python_dws.py 在Windows环境使用PyGreSQL第三方库连接集群 在Windows系统中,单击“开始”按钮 ,在搜索框中,键入cmd,然后在结果列表中单击“cmd.exe”打开命令提示符窗口。 在命令提示符窗口中,执行以下命令创建python_dws
FULL失败。且由于需要等待Binlog记录消费完毕,所以即使VACUUM FULL一个分区表,也会对分区的主表上7级锁,阻塞整个表的插入更新或者删除。 Binlog表在备份恢复期间,仅会被当做普通HStore表进行备份,恢复后辅助表的增量数据与同步点信息会清空,需要重新开始同步。
FULL失败。且由于需要等待Binlog记录消费完毕,所以即使VACUUM FULL一个分区表,也会对分区的主表上7级锁,阻塞整个表的插入更新或者删除。 Binlog表在备份恢复期间,仅会被当做普通HStore表进行备份,恢复后辅助表的增量数据与同步点信息会清空,需要重新开始同步。
PG_REDACTION_COLUMN系统表存储脱敏列的信息。 表1 PG_REDACTION_COLUMN字段 名称 类型 描述 object_oid oid 脱敏对象OID。 column_attrno smallint 脱敏列attrno。 function_type integer 脱敏类型。 说明:
PG_REDACTION_COLUMN系统表存储脱敏列的信息。 表1 PG_REDACTION_COLUMN字段 名称 类型 描述 object_oid oid 脱敏对象OID。 column_attrno smallint 脱敏列attrno。 function_type integer 脱敏类型。 说明:
该视图仅9.1.0.200及以上集群版本支持。 表1 PGXC_LWLOCKS字段 名称 类型 描述 nodename name 被锁定对象的节点的名称。 pid bigint 后端线程ID。 query_id bigint 查询语句的ID。 lwtid integer 后端线程的轻量级线程号。
环境变量”,在系统环境变量Path中增加gsql路径。例如: 图2 设置Windows环境变量 (可选)如果要使用SSL方式连接集群,请参考使用SSL进行安全的TCP/IP连接章节,在客户端主机配置SSL认证相关的参数。 SSL连接方式的安全性高于非SSL方式,建议在客户端使用SSL连接方式。