MAPREDUCE服务 MRS-准备MapReduce样例初始数据:规划MapReduce统计样例程序数据
规划MapReduce统计样例程序数据
将待处理的日志文件放置在HDFS系统中。
- 在Linux系统中新建文本文件,将待处理的数据复制到文件中。例如将MapReduce统计样例程序开发思路中log1.txt中的内容复制保存到input_data1.txt,将log2.txt中的内容复制保存到input_data2.txt。
- 在HDFS上建立一个文件夹“/tmp/input”,并上传input_data1.txt,input_data2.txt到此目录,操作如下:
- 执行以下命令进入HDFS客户端目录并认证用户。
source bigdata_env
kinit 组件业务用户 (该用户需要具有操作HDFS的权限,首次认证需要修改密码)
- 执行以下命令创建“/tmp/input”目录。
hdfs dfs -mkdir /tmp/input
- 执行以下命令将已准备好的文件上传至HDFS客户端的“/tmp/input”目录下。
hdfs dfs -put local_filepath/input_data1.txt /tmp/input
hdfs dfs -put local_filepath/input_data2.txt /tmp/input
- 执行以下命令进入HDFS客户端目录并认证用户。
- MapReduce服务_什么是MapReduce服务_什么是HBase
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- 大数据分析是什么_使用MapReduce_创建MRS服务
- MRS备份恢复_MapReduce备份_数据备份
- MapReduce服务_什么是HDFS_HDFS特性
- MapReduce服务_什么是Hue_如何使用Hue
- MapReduce服务_什么是HetuEngine_如何使用HetuEngine
- MapReduce服务_什么是Kafka_如何使用Kafka
- MapReduce服务_什么是Hive_如何使用Hive
- MapReduce服务_什么是Yarn_如何使用Yarn