MAPREDUCE服务 MRS-HyperLogLog函数:数据结构
数据结构
HyperLogLog(hll)是一种统计基数的算法。它实际上不会存储每个元素出现的次数,它使用的是概率算法,通过存储元素的32位hash值的第一个1的位置,来计算元素数量。通常分为稀疏存储结构和密集存储结构两种。hll创建时是稀疏存储结构,当需要更高效处理时会转为密集型数据结构。P4HyperLogLog则在其整改生命周期都是密集型数据结构。如有必要,可以显式地转换cast(hll as P4HyperLogLog)。在当前数据引擎的实现中,hll的数据草图是通过一组32位的桶来存储对应的最大hash。
- MapReduce服务_什么是MapReduce服务_什么是HBase
- GaussDB函数_GaussDB数据库函数_高斯数据库函数_华为云
- MapReduce服务_什么是Flink_如何使用Flink
- GaussDB支持的函数_GaussDB函数类型解析_高斯数据库支持的函数-华为云
- GaussDB数据库函数_GaussDB函数和操作符_高斯数据库函数-华为云
- 调用函数_函数调用方式_函数工作流 FunctionGraph-华为云
- GaussDB数据库函数_GaussDB介绍_高斯数据库函数
- 什么是函数工作流_函数托管计算服务_函数工作流 FunctionGraph-华为云
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- 使用容器镜像部署函数_函数部署_函数工作流 FunctionGraph-华为云