华为云首页用户手册

MapReduce服务 MRS-MapReduce访问多组件样例程序开发思路:数据规划

MapReduce服务 MRS-MapReduce访问多组件样例程序开发思路:数据规划

时间：2025-02-12 15:00:33

MapReduce服务 MRS

数据规划

创建HDFS数据文件。
1. 在Linux系统上新建文本文件，将log1.txt中的内容复制保存到data.txt。
2. 在HDFS上创建一个文件夹“/tmp/examples/multi-components/mapreduce/input/”，并上传data.txt到此目录，命令如下：
  1. 登录HDFS客户端。
    cd 客户端安装目录
    
    source bigdata_env
  2. 在Linux系统HDFS客户端使用命令hdfs dfs -mkdir -p/tmp/examples/multi-components/mapreduce/input/
  3. 在Linux系统HDFS客户端使用命令hdfs dfs -putdata.txt /tmp/examples/multi-components/mapreduce/input/
创建HBase表并插入数据。
1. 在Linux系统HBase客户端执行source bigdata_env，并使用命令hbase shell。
2. 在HBase shell交互窗口创建数据表table1，该表有一个列族cf，使用命令create 'table1', 'cf'。
3. 插入一条rowkey为1、列名为cid、数据值为123的数据，使用命令put 'table1', '1', 'cf:cid', '123'。
4. 执行命令quit退出。
创建Hive表并载入数据。
1. 在Linux系统Hive客户端使用命令beeline。
2. 在Hive beeline交互窗口创建数据表person，该表有3个字段：name/gender/stayTime，使用命令CREATE TABLE person(name STRING, gender STRING, stayTime INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' stored as textfile;。
3. 在Hive beeline交互窗口加载数据文件，LOAD DATA INPATH'/tmp/examples/multi-components/mapreduce/input/'OVERWRITE INTO TABLE person;。
4. 执行命令!q退出。
由于Hive加载数据将HDFS对应数据目录清空，所以需再次执行1。

上一篇：MapReduce服务 MRS-MapReduce访问多组件样例程序开发思路:场景说明

下一篇：MapReduce服务 MRS-job.properties:参数解释

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

MapReduce服务 MRS-MapReduce访问多组件样例程序开发思路:数据规划

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题