检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参数类型:USERSET 取值范围:布尔型 on表示扫描可能从表的中间开始,然后选择"环绕"方式来覆盖所有的行,为了与已经在进行中的扫描活动同步。这可能会造成没有用ORDER BY子句的查询得到行排序造成不可预测的后果。 off表示确保顺序扫描是从表头开始的。 默认值:on enable_beta_features
HIRE_maxvalue VALUES LESS THAN (MAXVALUE) ); 选择分布键 Hash表的分布键选取至关重要,如果分布键选择不当,可能会导致数据倾斜,从而导致查询时,I/O负载集中在部分DN上,影响整体查询性能。因此,在确定Hash表的分布策略之后,需要对表数据进行倾斜性检查
HIRE_maxvalue VALUES LESS THAN (MAXVALUE) ); 选择分布键 Hash表的分布键选取至关重要,如果分布键选择不当,可能会导致数据倾斜,从而导致查询时,I/O负载集中在部分DN上,影响整体查询性能。因此,在确定Hash表的分布策略之后,需要对表数据进行倾斜性检查
O时序统计数据可以在pg_stat_database中查询。 参数类型:SUSET 取值范围:布尔型 on表示开启收集功能,开启时,收集器会重复地去查询当前时间的操作系统,这可能会引起某些平台的重大开销,故默认值设置为off。 off表示关闭收集功能。 默认值:off track_functions
O时序统计数据可以在pg_stat_database中查询。 参数类型:SUSET 取值范围:布尔型 on表示开启收集功能,开启时,收集器会重复地去查询当前时间的操作系统,这可能会引起某些平台的重大开销,故默认值设置为off。 off表示关闭收集功能。 默认值:off track_functions
HIRE_maxvalue VALUES LESS THAN (MAXVALUE) ); 选择分布键 Hash表的分布键选取至关重要,如果分布键选择不当,可能会导致数据倾斜,从而导致查询时I/O负载集中在部分DN上,影响整体查询性能。因此,在确定Hash表的分布策略之后,需要对表数据进行倾斜性检查,
PARTITION 删除分区 ALTER TABLE PARTITION 删除分区表 DROP TABLE 定义索引 索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。所涉及的SQL语句,请参考下表。 表5 索引定义相关SQL 功能 相关SQL
能指定长度在16以内的尽量指定,性能会翻倍提高,如果不能指定长度16以内,该优化手段不受益。 - 是,已有数据会重写。 2 Numeric类型 Numeric类型要求都指定精度,性能会翻倍提高,尽量不要用无精度的Numeric。 -- 是,已有数据会重写。 3 Partition by
STORAGE,则复制列的STORAGE设置会复制到新表中,默认情况下不包含STORAGE设置。 如果指定了INCLUDING COMMENTS,则源表列、约束和索引的注释会复制到新表中。默认情况下,不复制源表的注释。 如果指定了INCLUDING PARTITION,则源表的分区定义会复制到新表中,同时新表将不能再使用PARTITION
abcdefghijklmnopqrstuvwxyz0123456789。 数据文件中单行数据长度需<1GB,如果分隔符较长且数据列较多的情况下,会影响导出有效数据的长度。 分隔符推荐使用多字符和不可见字符。多字符例如'$^&';不可见字符例如E'\x07',E'\x08',E'\x1b'等。
100; 下面的基准表显示了本次实践中所用集群的验证结果。您的结果可能会因多方面的原因而有所变化,但规律性应该相差不大。考虑到操作系统缓存的影响,相同表结构的同一查询在每次执行时耗时会有不同属正常现象,建议多测试几次,取一组平均值。 基准 优化前 优化后 加载时间(11张表) 341584ms
参数说明:控制自诊断的日志级别。目前仅对多列统计信息进行控制。 参数类型:USERSET 取值范围:字符串 summary:显示简略的诊断信息。 detail:显示详细的诊断信息。 目前这两个参数值只在显示多列统计信息未收集的告警的情况下有差别,summary不显示未收集多列统计信息的告警,detail会显示这类告警。
表3 8.3.0.105新增功能/解决问题列表 类别 功能或问题描述 问题原因 问题出现版本 修复建议 新增功能 无 - - - 解决问题 多count distinct走share scan出现结果集错误 sharescan计划生成时,CTE子查询误用了上层的等价类信息,造成分布列判断错误,生成计划缺少数据重分布算子
0)还包含单机版模式。各产品类型的不同差异,详情请参见数据仓库类型。 低配置集群,如内存16G、vCPU4核及以下的规格,建议不要用于生产环境,可能会导致资源过载风险。 存算一体(DWS 2.0)规格 存算一体(DWS 2.0)1:8云盘规格,该规格弹性伸缩,无限算力、无限容量,规格详情请参见表1。
STORAGE,则复制列的STORAGE设置会复制到新表中,默认情况下不包含STORAGE设置。 如果指定了INCLUDING COMMENTS,则源表列、约束和索引的注释会复制到新表中。默认情况下,不复制源表的注释。 如果指定了INCLUDING PARTITION,则源表的分区定义会复制到新表中,同时新表将不能再使用PARTITION
参数说明:控制自诊断的日志级别。目前仅对多列统计信息进行控制。 参数类型:USERSET 取值范围:字符串 summary:显示简略的诊断信息。 detail:显示详细的诊断信息。 目前这两个参数值只在显示多列统计信息未收集的告警的情况下有差别,summary不显示未收集多列统计信息的告警,detail会显示这类告警。
GaussDB(DWS)的数据库概念 数据库 数据库用于管理各类数据对象,与其他数据库隔离。创建数据库时可以指定对应的表空间,如果不指定相应的表空间,相关的对象会默认保存在PG_DEFAULT空间中。数据库管理的对象可分布在多个表空间上。 联机分析处理 联机分析处理(Online Analytical
HASH(product_no); 局部聚簇 局部聚簇通过min/max稀疏索引较快的实现基表扫描的filter过滤。Partial Cluster Key可以指定多列,但是一般不建议超过2列。 创建表products,PCK为product_no: 1 2 3 4 5 6 7 CREATE TABLE products
概述 GaussDB(DWS)数据库支持通过OBS外表并行导出数据:通过OBS外表设置的导出模式、导出数据格式等信息来指定导出的数据文件,利用多DN并行的方式,将数据从GaussDB(DWS)数据库导出到外部,存放在OBS对象存储服务器上,从而提高整体导出性能。 CN只负责任务的规划
(SQL on other GaussDB(DWS)) 删除外表 DROP FOREIGN TABLE 定义索引 索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。所涉及的SQL语句,请参考下表。 表6 索引定义相关SQL 功能 相关SQL