Group 算子说明 Group算子用于处理Group By子句,对下层排序元组进行分组操作,返回结果是按分组键分组后的结果。 典型场景 分组操作:查询某列有多少个不同的值,其作用类似于DISTINCT。 示例 示例:查询语句中包含GROUP BY子句 --数据准备。 gaussdb=#
SetOp 算子说明 SetOp算子用于将两个或多个查询结果合并成一个结果集。SetOp算子包括INTERSECT和EXCEPT。 典型场景 INTERSECT:返回两个查询结果的交集,即两个结果集中都存在的行。 INTERSECT ALL:返回两个查询结果的交集,包括重复的行。
WindowAgg 算子说明 WindowAgg算子用于处理元组窗口聚合,WindowAgg算子与Agg算子在功能上类似,实现的模式也相似。主要的区别在于,WindowAgg算子处理的元组限定于同一个窗口内,而Agg算子处理的元组是“整个表”(GROUP BY划分)。 典型场景
Unpivot 算子说明 转置算子。用于将行转换为列。这个操作可以将一张表中的多列数据转换为两列,其中一列是原始表中的列名,另一列是对应的值。 典型场景 查询使用unpivot转置的表。 示例 示例:查询使用unpivot转置的表。 --UNPIVOT语法只能在O兼容库中使用 gaussdb=#
Agg 算子说明 Agg算子是用于执行聚集计算的算子, 支持3种策略处理:普通聚集(不分组只做聚集)、排序聚集和哈希聚集。排序聚集和哈希聚集因为涉及到分组,需要和group by搭配一起使用。排序聚集和哈希聚集的差别在于,排序聚集的输入必须是有序的,而哈希聚集则不关注输入的顺序性
Group 算子说明 Group算子用于处理Group By子句,对下层排序元组进行分组操作,返回结果是按分组键分组后的结果。 典型场景 分组操作:查询某列有多少个不同的值,其作用类似于DISTINCT。 示例 示例:查询语句中包含GROUP BY子句 --数据准备。 gaussdb=#
SetOp 算子说明 SetOp算子用于将两个或多个查询结果合并成一个结果集。SetOp算子包括INTERSECT和EXCEPT。 典型场景 INTERSECT:返回两个查询结果的交集,即两个结果集中都存在的行。 INTERSECT ALL:返回两个查询结果的交集,包括重复的行。
RecursiveUnion 算子说明 RecursiveUnion算子用于处理递归调用的UNION语句,该类语句通常出现在CTE表达式中。常见的语法逻辑为:有一个初始输入集作为递归过程的初始数据,然后开始进行递归调用得到输出,最后将本次递归调用的输出作为下次递归调用的输入,循环调用得到最终的输出。
Unique 算子说明 对下层的数据进行去重处理。在执行过程中,它将会遍历所有输入的数据,对其中的重复记录进行筛选,只保留唯一的记录。 典型场景 关闭enable_hashagg参数,使用带distinct查询。 示例 示例:使用带DISTINCT查询。 --数据准备。 gaussdb=#
Unpivot 算子说明 转置算子。用于将行转换为列。这个操作可以将一张表中的多列数据转换为两列,其中一列是原始表中的列名,另一列是对应的值。 典型场景 查询使用unpivot转置的表。 示例 示例:查询使用unpivot转置的表。 --数据准备。 gaussdb=# CREATE
GS_SPM_SQL GS_SPM_SQL是SPM计划管理特性中的系统表,当前该特性在分布式中不支持。它用于存储SPM SQL相关信息的系统表,具备sysadmin权限的用户可以对该系统表进行读操作,但只有初始用户才可以对该系统表进行写操作。 表1 GS_SPM_SQL字段 名称
GS_SPM_PARAM GS_SPM_PARAM是SPM计划管理特性中的系统表,当前该特性在分布式中不支持。它用于存储SQL参数相关信息的系统表,每个SQL只存储一组参数,具备sysadmin权限的用户可以对该系统表进行读操作,但只有初始用户才可以对该系统表进行写的操作。 表1
SetOp 算子说明 SetOp算子用于将两个或多个查询结果合并成一个结果集。SetOp算子包括INTERSECT和EXCEPT。 典型场景 INTERSECT:返回两个查询结果的交集,即两个结果集中都存在的行。 INTERSECT ALL:返回两个查询结果的交集,包括重复的行。
Agg 算子说明 Agg算子是用于执行聚集计算的算子, 支持3种策略处理:普通聚集(不分组只做聚集)、排序聚集和哈希聚集。排序聚集和哈希聚集因为涉及到分组,需要和group by搭配一起使用。排序聚集和哈希聚集的差别在于,排序聚集的输入必须是有序的,而哈希聚集则不关注输入的顺序性
Unique 算子说明 对下层的数据进行去重处理。在执行过程中,它将会遍历所有输入的数据,对其中的重复记录进行筛选,只保留唯一的记录。 典型场景 关闭enable_hashagg参数,使用带distinct查询。 示例 示例:使用带DISTINCT查询。 --数据准备。 gaussdb=#
Agg 算子说明 Agg算子是用于执行聚集计算的算子, 支持3种策略处理:普通聚集(不分组只做聚集)、排序聚集和哈希聚集。排序聚集和哈希聚集因为涉及到分组,需要和group by搭配一起使用。排序聚集和哈希聚集的差别在于,排序聚集的输入必须是有序的,而哈希聚集则不关注输入的顺序性
Group 算子说明 Group算子用于处理Group By子句,对下层排序元组进行分组操作,返回结果是按分组键分组后的结果。 典型场景 分组操作:查询某列有多少个不同的值,其作用类似于DISTINCT。 示例 示例:查询语句中包含GROUP BY子句 --数据准备。 gaussdb=#
SetOp 算子说明 SetOp算子用于将两个或多个查询结果合并成一个结果集。SetOp算子包括INTERSECT和EXCEPT。 典型场景 INTERSECT:返回两个查询结果的交集,即两个结果集中都存在的行。 INTERSECT ALL:返回两个查询结果的交集,包括重复的行。
Spark从HBase读取数据再写入HBase样例程序(Java) 功能介绍 用户可以使用Spark调用HBase接口来操作HBase table1表,然后把table1表的数据经过分析后写到HBase table2表中。 代码样例 下面代码片段仅为演示,具体代码参见:com.huawei
Spark从Hive读取数据再写入HBase样例程序(Java) 功能介绍 在Spark应用中,通过使用Spark调用Hive接口来操作hive表,然后把Hive表的数据经过分析后写到HBase表。 代码样例 下面代码片段仅为演示,具体代码参见:com.huawei.bigdata
您即将访问非华为云网站,请注意账号财产安全