MAPREDUCE服务 MRS-Spark应用开发简介:Spark SQL常用概念
Spark SQL常用概念
DataSet
DataSet是一个由特定域的对象组成的强类型集合,可通过功能或关系操作并行转换其中的对象。 每个Dataset还有一个非类型视图,即由多个列组成的DataSet,称为DataFrame。
DataFrame是一个由多个列组成的结构化的分布式数据集合,等同于关系数据库中的一张表,或者是R/Python中的data frame。DataFrame是Spark SQL中的最基本的概念,可以通过多种方式创建,例如结构化的数据集、Hive表、外部数据库或者是RDD。
- 什么是Spark SQL作业_数据湖探索DLISpark SQL作业
- 什么是Spark_如何使用Spark_Spark的功能是什么
- MapReduce服务_什么是Hue_如何使用Hue
- MySQL数据库简介_MySQL数据库应用_MySQL授权多个数据库
- MapReduce工作原理_MapReduce是什么意思_MapReduce流程_MRS_华为云
- ModelArts开发环境_开发环境简介_开发环境怎么使用
- MapReduce服务_什么是HetuEngine_如何使用HetuEngine
- GaussDB常用概念_产品介绍_高斯数据库常用概念-华为云
- MES系统简介_MES应用_上海 MES
- MapReduce服务_什么是Flink_如何使用Flink