MAPREDUCE服务 MRS-聚合函数:统计聚合函数

时间:2024-11-28 20:08:12

统计聚合函数

  • corr(y,x)

    描述:返回输入值的相关系数。

    select corr(y,x) from (values (1,5),(2,6),(3,7),(4,8)) as t(x,y);-- 1.0
  • covar_pop(y, x)

    描述:返回输入值的总体协方差。

    select covar_pop(y,x) from (values (1,5),(2,6),(3,7),(4,8)) as t(x,y); --1.25
  • covar_samp(y, x)

    描述:返回输入值的样本协方差。

    select covar_samp(y,x) from (values (1,5),(2,6),(3,7),(4,8)) as t(x,y);-- 1.6666666 
  • kurtosis(x)

    描述:峰度又称峰态系数,表征概率密度分布曲线在平均值处峰值高低的特征数,即是描述总体中所有取值分布形态陡缓程度的统计量。直观看来,峰度反映了峰部的尖度。这个统计量需要与正态分布相比较。

    定义上峰度是样本的标准四阶中心矩(standardized 4th central moment)。

    随机变量的峰度计算方法为随机变量的四阶中心矩与方差平方的比值。

    具体计算公式为:

    select kurtosis(x) from (values (1),(2),(3),(4)) as t(x); -- -1.1999999999999993
  • regr_intercept(y, x)

    描述:返回输入值的线性回归截距。y是从属值。x是独立值。

    select regr_intercept(y,x) from (values (1,5),(2,6),(3,7),(4,8)) as t(x,y);-- 4.0
  • regr_slope(y, x)

    描述:返回输入值的线性回归斜率。y是从属值。x是独立值。

    select regr_slope(y,x) from (values (1,5),(2,6),(3,7),(4,8)) as t(x,y);--  1.0
  • skewness(x)

    描述:返回所有输入值的偏斜度。

    select skewness(x) from (values (1),(2),(3),(4)) as t(x); -- 0.0
  • stddev(x)

    描述:stedev_samp()的别名。

  • stddev_pop(x)

    描述:返回所有输入值的总体标准差。

    select stddev_pop(x) from (values (1),(2),(3),(4)) as t(x);--  1.118033988749895
  • stddev_samp(x)

    描述:返回所有输入值的样本标准偏差。

    select stddev_samp(x) from (values (1),(2),(3),(4)) as t(x);--  1.2909944487358056
  • variance(x)

    描述:var_samp()的别名。

  • var_pop(x)

    描述:返回所有输入值的总体方差。

    select var_pop(x) from (values (1),(2),(3),(4)) as t(x);-- 1.25
  • var_samp(x)

    描述:返回所有输入值的样本方差。

    select var_samp(x) from (values (1),(2),(3),(4)) as t(x);--  1.6666666666666667
support.huaweicloud.com/cmpntguide-lts-mrs/mrs_01_300205.html