MAPREDUCE服务 MRS-在Hue WebUI使用元数据浏览器:手工创建一个Hive表
手工创建一个Hive表
- 访问“Metastore Manager”,在“Databases”选择一个数据库。
默认数据库为“default”。
- 单击,进入“Create a new table manually”页面。
- 设置表名称。
- 在“Table Name”填写Hive表的名称。
支持字母、数字、下划线,首位必须为字母或数字,且长度不能超过128位。
- 根据需要,在“Description”填写Hive表的描述信息。
- 单击“Next”。
- 在“Table Name”填写Hive表的名称。
- 选择一个存储数据的格式。
- 配置分隔符。
- 在“Field terminator”设置一个列分隔符。
如果分隔符不在列表中,选择“Other..”,然后输入新定义的分隔符。
- 在“Collection terminator”设置一个分隔符,用于分隔Hive中类型为“array”的列的数据集合。例如一个列为array类型,其中一个值需要保存“employee”和“manager”,用户指定分隔符为“:”,则最终的值为“employee:manager”。
- 在“Map key terminator”设置一个分隔符,用于分隔Hive中类型为“map”的列的数据。例如某个列为map类型,其中一个值需要保存描述为“aaa”的“home”,和描述为“bbb”的“company”,用户指定分隔符为“|”,则最终的值为“home|aaa:company|bbb”。
- 单击“Next”,执行7。
- 在“Field terminator”设置一个列分隔符。
- 设置序列化属性。
- 在“SerDe Name”输入序列化格式的类名称“org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe”。
用户可扩展Hive支持更多自定义的序列化类。
- 在“Serde properties”输入序列化的样式的值:“"field.delim"="," "colelction.delim"=":" "mapkey.delim"="|"”。
- 单击“Next”,执行7。
- 在“SerDe Name”输入序列化格式的类名称“org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe”。
- 选择一个数据表的格式,并单击“Next”。
- “TextFile”表示使用文本类型文件存储数据。
- “SequenceFile”表示使用二进制类型文件存储数据。
- “InputFormat”表示使用自定义的输入输出格式来使用文件中的数据。
用户可扩展Hive支持更多的自定义格式化类。
- 在“InputFormat Class”填写输入数据使用的类“org.apache.hadoop.hive.ql.io.RCFileInputFormat”。
- 在“OutputFormat Class”填写输出数据使用的类“org.apache.hadoop.hive.ql.io.RCFileOutputFormat”。
- 选择一个文件保存位置,并单击“Next”。
默认勾选“Use default location”。如果需要自定义存储位置,请取消选中状态并在“External location”单击指定一个文件存储位置。
- 设置Hive表的字段。
- 在“Column name”设置列的名称。
支持字母、数字、下划线,首位必须为字母或数字,且长度不能超过128位。
- 在“Column type”选择一个数据类型。
单击“Add a column”可增加新的列。
- 单击“Add a partition”为Hive表增加分区,可提高查询效率。
- 在“Column name”设置列的名称。
- 单击“Create Table”创建表,等待Hue显示Hive表的信息。
- MapReduce服务_什么是Hue_如何使用Hue
- MapReduce服务_什么是Loader_如何使用Loader
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- MapReduce服务_什么是Hive_如何使用Hive
- 什么是Manager_Manager的功能_MRS运维管理
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离
- 大数据分析是什么_使用MapReduce_创建MRS服务
- MRS备份恢复_MapReduce备份_数据备份
- MapReduce服务_什么是Yarn_如何使用Yarn
- MapReduce服务_什么是MapReduce服务_什么是HBase