MAPREDUCE服务 MRS-MapReduce统计样例程序开发思路:数据规划

时间:2024-06-29 14:11:08

数据规划

首先需要把原日志文件放置在HDFS系统里。

  1. 在Linux系统上新建两个文本文件,将log1.txt中的内容复制保存到input_data1.txt,将log2.txt中的内容复制保存到input_data2.txt。
  2. 在HDFS上建立一个文件夹,“/tmp/input”,并上传input_data1.txt,input_data2.txt到此目录,命令如下:
    1. 在Linux系统HDFS客户端使用命令hdfs dfs -mkdir /tmp/input
    2. 在Linux系统HDFS客户端使用命令hdfs dfs -put local_filepath /tmp/input
support.huaweicloud.com/devg3-mrs/mrs_07_360011.html