MAPREDUCE服务 MRS-聚合函数:统计聚合函数
统计聚合函数
- corr(y,x)
select corr(y,x) from (values (1,5),(2,6),(3,7),(4,8)) as t(x,y);-- 1.0
- covar_pop(y, x)
select covar_pop(y,x) from (values (1,5),(2,6),(3,7),(4,8)) as t(x,y); --1.25
- covar_samp(y, x)
描述:返回输入值的样本协方差。
select covar_samp(y,x) from (values (1,5),(2,6),(3,7),(4,8)) as t(x,y);-- 1.6666666
- kurtosis(x)
描述:峰度又称峰态系数,表征概率密度分布曲线在平均值处峰值高低的特征数,即是描述总体中所有取值分布形态陡缓程度的统计量。直观看来,峰度反映了峰部的尖度。这个统计量需要与正态分布相比较。
定义上峰度是样本的标准四阶中心矩(standardized 4th central moment)。
随机变量的峰度计算方法为随机变量的四阶中心矩与方差平方的比值。
具体计算公式为:
select kurtosis(x) from (values (1),(2),(3),(4)) as t(x); -- -1.1999999999999993
- regr_intercept(y, x)
select regr_intercept(y,x) from (values (1,5),(2,6),(3,7),(4,8)) as t(x,y);-- 4.0
- regr_slope(y, x)
select regr_slope(y,x) from (values (1,5),(2,6),(3,7),(4,8)) as t(x,y);-- 1.0
- skewness(x)
select skewness(x) from (values (1),(2),(3),(4)) as t(x); -- 0.0
- stddev(x)
- stddev_pop(x)
select stddev_pop(x) from (values (1),(2),(3),(4)) as t(x);-- 1.118033988749895
- stddev_samp(x)
select stddev_samp(x) from (values (1),(2),(3),(4)) as t(x);-- 1.2909944487358056
- variance(x)
- var_pop(x)
select var_pop(x) from (values (1),(2),(3),(4)) as t(x);-- 1.25
- var_samp(x)
select var_samp(x) from (values (1),(2),(3),(4)) as t(x);-- 1.6666666666666667
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- GaussDB函数_GaussDB数据库函数_高斯数据库函数_华为云
- GaussDB支持的函数_GaussDB函数类型解析_高斯数据库支持的函数-华为云
- 调用函数_函数调用方式_函数工作流 FunctionGraph-华为云
- GaussDB数据库函数_GaussDB函数和操作符_高斯数据库函数-华为云
- GaussDB数据库函数_GaussDB介绍_高斯数据库函数
- 什么是函数工作流_函数托管计算服务_函数工作流 FunctionGraph-华为云
- 使用容器镜像部署函数_函数部署_函数工作流 FunctionGraph-华为云
- 如何使用模板创建函数_模板创建函数_函数工作流 FunctionGraph-华为云
- MapReduce服务_什么是Flink_如何使用Flink