检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
空间始终是1280bytes常数级别。 当前默认规格下可计算最大distinct值的数量为1.6e+12个,误差率最大仅2.3%。用户应注意如果计算结果超过当前规格下distinct最大值会导致计算结果误差率变大,或导致计算结果失败并报错。 用户在首次使用该特性时,应该对业务的distinct
GaussDB(DWS)的自定义函数语句对其进行改写。 函数:CRC32(expr) 描述:用于计算循环冗余值。入参expr为字符串。如果参数为NULL,则返回NULL;否则,在计算冗余后返回32位无符号值。 GaussDB(DWS)的自定义函数语句改写CRC32函数示例: 1
定。该索引将在创建索引表的模式中自动创建。 图1 输入:索引 图2 输出:索引 输入:基于CASE函数的索引 函数索引是基于列函数或表达式计算结果创建的索引。 输入 1 2 3 4 5 6 7 8 9 CREATE UNIQUE index GCC_RSRC_ASSIGN_U1
分析函数 分析函数根据一组行计算一个聚合值。它与聚集函数的不同之处在于,它为每个组返回多行。分析函数通常用于计算累积值,数据移动值,中间值和报告聚合值。DSC支持分析函数,包括RATIO_TO_REPORT函数。 输入:分析函数 1 2 3 4 5 SELECT empno, ename
Cost代价估算优化。 Analyze强化,支持临时表,支持单事务操作。 向量化引擎性能提升。 分区剪枝优化,当前分区剪枝只能针对常量进行,而对于需要计算的变量不能剪枝,针对此问题进行优化。 新增全量备份(schema粒度)+ 细粒度恢复(表级、schema级)。 GDS支持第三方自定义数据转换。
9 创建表时必须选择正确的分布方式和分布列 违反规范的影响: 分布式和分布列选择错误,导致表数据存储倾斜,访问性能下降,严重情况会触发存储和计算资源过载。 方案建议: 创建表时通过DISTRIBUTE BY显式指定分布方式和分布列,分布列选择原则如下表所示。 表1 分布列选择原则 分布方式
9 创建表时必须选择正确的分布方式和分布列 违反规范的影响: 分布式和分布列选择错误,导致表数据存储倾斜,访问性能下降,严重情况会触发存储和计算资源过载。 方案建议: 创建表时通过DISTRIBUTE BY显式指定分布方式和分布列,分布列选择原则如下表所示。 表1 分布列选择原则 分布方式
集群缩容 当用户需要的计算或者存储资源超出业务需求时,可在管理控制台对已有集群进行缩容操作,以便充分利用GaussDB(DWS)提供的计算资源和存储资源。 缩容按需计费模式集群仅8.1.1.300及以上集群版本支持,包周期计费模式的集群仅8.2.1及以上集群版本支持。 缩容的节点默认是按节点数计费。
导入数据最佳实践 从OBS并行导入数据 将导入数据拆分为多个文件 导入大数据量的数据时,通常需要较长的时间及耗费较多的计算资源。 从OBS上导入数据时,如下方法可以提升导入性能:将数据文件存储到OBS前,尽可能均匀地将文件切分成多个,文件的数量为DN的整数倍更适合。 在导入前后验证数据文件
和存储倾斜相比,计算倾斜更难以提前识别,因此GaussDB提出了RLBT(Runtime Load Balance Technology)方案,用于解决运行时的计算倾斜问题,该特性由参数skew_option控制。RLBT方案主要分为两个层面,第一步是计算倾斜识别,第二步是计算倾斜解决。下面分别进行介绍。
circle 24 字节 圆 <(x,y),r> (圆心和半径) GaussDB(DWS)提供了一系列的函数和操作符用来进行各种几何计算,如拉伸、转换、旋转、计算相交等。详细信息请参考几何函数和操作符。 点 点是几何类型的基本二维构造单位。用下面语法描述point的数值: ( x , y
数值大小相同的参数使用不同数据类型的哈希函数计算,最后结果会不一样,因为不同类型哈希函数会选取不同的哈希计算策略。 hll_hash_smallint(smallint, int32) 描述:设置hash seed(即改变哈希策略)同时对smallint类型数据计算哈希值。 返回值类型:hll_hashval
circle 24 字节 圆 <(x,y),r> (圆心和半径) GaussDB(DWS)提供了一系列的函数和操作符用来进行各种几何计算,如拉伸、转换、旋转、计算相交等。详细信息请参考几何函数和操作符。 点 点是几何类型的基本二维构造单位。用下面语法描述point的数值: ( x , y
STATS_AUTO_RECALC STATS_AUTO_RECALC指定是否为InnoDB表自动重新计算持久性统计信息。GaussDB(DWS)不支持该属性,DSC迁移时会将该关键字属性。 输入示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14
数值大小相同的参数使用不同数据类型的哈希函数计算,最后结果会不一样,因为不同类型哈希函数会选取不同的哈希计算策略。 hll_hash_smallint(smallint, int32) 描述:设置hash seed(即改变哈希策略)同时对smallint类型数据计算哈希值。 返回值类型:hll_hashval
窗口函数 普通的聚集函数只能用来计算一行内的结果,或者把所有行聚集成一行结果。而窗口函数可以跨行计算,并且把结果填到每一行中。 通过查询筛选出的行的某些部分,窗口调用函数实现了类似于聚集函数的功能,所以聚集函数也可以作为窗口函数使用。 窗口函数可以扫描所有的行,并同时将原始数据和聚集分析结果同时显示出来。
窗口函数 普通的聚集函数只能用来计算一行内的结果,或者把所有行聚集成一行结果。而窗口函数可以跨行计算,并且把结果填到每一行中。 通过查询筛选出的行的某些部分,窗口调用函数实现了类似于聚集函数的功能,所以聚集函数也可以作为窗口函数使用。 窗口函数可以扫描所有的行,并同时将原始数据和聚集分析结果同时显示出来。
和存储倾斜相比,计算倾斜更难以提前识别,因此GaussDB提出了RLBT(Runtime Load Balance Technology)方案,用于解决运行时的计算倾斜问题,该特性由参数skew_option控制。RLBT方案主要分为两个层面,第一步是计算倾斜识别,第二步是计算倾斜解决。下面分别进行介绍。
通过数据库后端读取数据文件块花费的时间,以毫秒计算。 ≥ 0.0 通过数据库后端写入数据文件块花费的时间,以毫秒计算。 ≥ 0.0 由于数据库恢复冲突取消的查询数量(只在备用服务器发生的冲突)。 ≥ 0 通过数据库查询创建的临时文件数量。计算所有临时文件(比如排序或哈希),并且忽略log_temp_files设置。
DUAL视图是数据库根据数据字典自动创建的,它只有一个文本字段,且只有一行,用于保存表达式计算结果。任何用户都可以访问它。 表1 DUAL字段 名称 类型 描述 dummy text 表达式计算结果。 父主题: 系统视图