-
Hive基本原理
熟悉SQL的用户查询数据。Hive的数据计算依赖于MapReduce、Spark、Tez。 使用新的执行引擎Tez代替原先的MapReduce,性能有了显著提升。Tez可以将多个有依赖的作业转换为一个作业(这样只需写一次HDFS,且中间节点较少),从而大大提升DAG作业的性能。 Hive主要特点如下:
来自:百科 -
面对IoT数据的爆发,传统大数据平台架构正在发生哪些适应性变化?
一、传统大数据平台Lambda架构: 两条数据流独立处理: 1.实时流,多采用Flink,Storm或者Spark Streaming 2.批处理,如采用MapReduce,Spark SQL等 关键问题: 1.计算结果容易不一致,如批计算的结果更全面,与流计算有差异 2.IoT时代数据量巨大,夜间批计算时间窗可能不够3
来自:百科 -
华为云MapReduce服务
-
Alluxio是什么
-
华为云MapReduce服务集群管理
-
GaussDB(DWS) 与Hive的差别
-
MapReduce服务 MRS集群操作指导
-
文档数据库是专门放文档类数据用的吗?
-
华为云MapReduce执行Spark SQL语句
-
Kudu是什么
-
Flume是什么
-
Ambari是什么
-
华为云MapReduce服务终止集群
-
什么是Flink OpenSource SQL_数据湖探索_Flink OpenSource SQL
-
MapReduce服务_什么是HetuEngine_如何使用HetuEngine
-
Spark
-
华为云MapReduce服务创建MRS集群
-
文档数据库的应用场景
-
基于MapReduce服务 MRS分析车主驾驶行为
-
时间戳
-
什么是弹性资源池_数据湖探索DLI弹性资源池