MapReduce服务 MRS-在本地Windows环境中调测Spark应用:编包并运行程序
编包并运行程序
- 获取样例代码。
下载样例工程的Maven工程源码和配置文件,请参见获取 MRS 应用开发样例工程。
将样例代码导入IDEA中。
- 获取配置文件。
从集群的客户端中获取文件。在“$SPARK_HOME/conf”中下载hive-site.xml与spark-defaults.conf文件到本地。
- 在HDFS中上传数据。
- 在Liunx中新建文本文件data,将如下数据内容保存到data文件中。
Miranda,32 Karlie,23 Candice,27
- 在Linux系统HDFS客户端使用命令hadoop fs -mkdir /data(hdfs dfs命令有同样的作用),创建对应目录。
- 在Linux系统HDFS客户端使用命令hadoop fs -put data /data,上传数据文件。
- 在Liunx中新建文本文件data,将如下数据内容保存到data文件中。
- 在样例代码中配置相关参数。
将加载数据的sql语句改为“LOAD DATA INPATH 'hdfs:/data/data' INTO TABLE CHILD”。
- 在程序运行时添加运行参数,分别为hive-site.xml与spark-defaults.conf文件的路径。
- 运行程序。
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- 大数据分析是什么_使用MapReduce_创建MRS服务
- 什么是Spark_如何使用Spark_Spark的功能是什么
- MapReduce服务_什么是Yarn_如何使用Yarn
- 数据备份归档在哪里_数据分析存储系统_大数据存储管理
- ModelArts推理部署_在线服务_访问在线服务-华为云
- MapReduce工作原理_MapReduce是什么意思_MapReduce流程_MRS_华为云
- MapReduce服务_什么是HDFS_HDFS特性
- Astro轻应用_低代码开发平台Astro Zero_码农防脱神器
- MapReduce服务_什么是ZooKeeper_如何使用ZooKeeper