MAPREDUCE服务 MRS-TABLESAMPLE:SYSTEM

时间:2024-07-02 16:39:54

SYSTEM

此采样方法将表划分为数据的逻辑段,并按此粒度对表进行采样。此采样方法要么从特定数据段中选择所有行,要么跳过它(基于采样百分比与运行时计算的随机值之间的比较)。系统采样中行的选择依赖于使用的connector。例如,如果使用Hive数据源,这将取决于数据在HDFS上的布局。这种采样方法不能保证独立的抽样概率。

SELECT * FROM users TABLESAMPLE SYSTEM (75);
support.huaweicloud.com/cmpntguide-lts-mrs/mrs_01_300185.html