MAPREDUCE服务 MRS-快速使用Hive进行数据分析:操作步骤
操作步骤
- 以客户端安装用户,登录安装客户端的节点,客户端安装详细操作请参见安装客户端(3.x及之后版本)。
- 执行以下命令切换到客户端目录,客户端安装目录如:/opt/client。
cd /opt/client
- 执行以下命令配置环境变量。
source bigdata_env
- 如果当前集群已启用Kerberos认证,执行以下命令认证当前用户,当前用户需要具有创建Hive表的权限,具体请参见创建角色配置拥有对应权限的角色,参考创建用户为用户绑定对应角色。如果当前集群未启用Kerberos认证,则无需执行此命令。
kinit MRS 集群用户
例如,kinit hiveuser。
- 运行Hive客户端命令,实现A业务。
- 内部表操作
- 执行以下命令登录Hive客户端命令行:
- 根据表1创建用户信息表user_info并添加相关数据,例如:
create table user_info(id string,name string,gender string,age int,addr string);
insert into table user_info(id,name,gender,age,addr) values("12005000201","A","男",19,"A城市");
- 在用户信息表user_info中新增用户的学历、职称信息。
以增加编号为12005000201的用户的学历、职称信息为例,其他用户类似。
alter table user_info add columns(education string,technical string);
- 根据用户编号查询用户姓名和地址。
以查询编号为12005000201的用户姓名和地址为例,其他用户类似。
select name,addr from user_info where id='12005000201';
- 删除用户信息表。
- 执行以下命令退出Hive客户端。
- 外部分区表操作
- 可使用insert语句直接向外部表中插入数据,也可以使用load data命令导入HDFS中的文件数据到外部表中。如果需要使用load data命令导入文件数据,需执行以下操作:
- 执行以下命令创建外部表数据存储路径:
hdfs dfs -mkdir /hive/user_info
- 执行以下命令登录Hive客户端命令行:
- 执行以下命令创建表:
create external table user_info(id string,name string,gender string,age int,addr string) partitioned by(year string) row format delimited fields terminated by ' ' lines terminated by '\n' stored as textfile location '/hive/user_info';
- fields terminated:表示分隔的字符,如按空格分隔,' '。
- lines terminated:表示分行的字符,如按换行分隔,'\n'。
- /hive/user_info:存储表user_info数据的HDFS路径。
- 导入数据。
- 使用insert语句插入数据,以插入编号为12005000201的用户相关信息为例,其他用户类似。
insert into user_info partition(year="2018") values ("12005000201","A","男",19,"A城市");
- 使用load data命令导入文件数据。
load data inpath '/tmp/txt.log' into table user_info partition (year='2011');
其中,“/tmp/txt.log”为5.a上传至HDFS的数据文件。
- 使用insert语句插入数据,以插入编号为12005000201的用户相关信息为例,其他用户类似。
- 执行以下命令查询导入数据。
- 执行以下命令删除用户信息表。
- 执行以下命令退出Hive客户端。
- 内部表操作
- MapReduce服务_什么是Hive_如何使用Hive
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- 大数据分析是什么_使用MapReduce_创建MRS服务
- 性能测试使用教程_性能测试操作步骤_性能测试快速入门-华为云
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离
- Hudi服务_什么是Hudi_如何使用Hudi
- MapReduce服务_什么是Hue_如何使用Hue
- MRS备份恢复_MapReduce备份_数据备份
- MapReduce服务_什么是Loader_如何使用Loader
- MapReduce服务_什么是Kafka_如何使用Kafka