华为云首页用户手册

MAPREDUCE服务 MRS-在Hue WebUI使用元数据浏览器:手工创建一个Hive表

时间：2024-06-29 16:25:20

MAPREDUCE服务 MRS 使用Hue（MRS 3.x之前版本）

手工创建一个Hive表

访问“Metastore Manager”，在“Databases”选择一个数据库。
默认数据库为“default”。
单击，进入“Create a new table manually”页面。
设置表名称。
1. 在“Table Name”填写Hive表的名称。
  支持字母、数字、下划线，首位必须为字母或数字，且长度不能超过128位。
2. 根据需要，在“Description”填写Hive表的描述信息。
3. 单击“Next”。
选择一个存储数据的格式。
- 需要使用分隔符分隔数据时，选择“Delimited”，然后执行5。
- 需要使用序列化格式保存数据时，选择“SerDe”，执行6。
配置分隔符。
1. 在“Field terminator”设置一个列分隔符。
  如果分隔符不在列表中，选择“Other..”，然后输入新定义的分隔符。
2. 在“Collection terminator”设置一个分隔符，用于分隔Hive中类型为“array”的列的数据集合。例如一个列为array类型，其中一个值需要保存“employee”和“manager”，用户指定分隔符为“:”，则最终的值为“employee:manager”。
3. 在“Map key terminator”设置一个分隔符，用于分隔Hive中类型为“map”的列的数据。例如某个列为map类型，其中一个值需要保存描述为“aaa”的“home”，和描述为“bbb”的“company”，用户指定分隔符为“|”，则最终的值为“home|aaa:company|bbb”。
4. 单击“Next”，执行7。
设置序列化属性。
1. 在“SerDe Name”输入序列化格式的类名称“org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe”。
  用户可扩展Hive支持更多自定义的序列化类。
2. 在“Serde properties”输入序列化的样式的值：“"field.delim"="," "colelction.delim"=":" "mapkey.delim"="|"”。
3. 单击“Next”，执行7。
选择一个数据表的格式，并单击“Next”。
- “TextFile”表示使用文本类型文件存储数据。
- “SequenceFile”表示使用二进制类型文件存储数据。
- “InputFormat”表示使用自定义的输入输出格式来使用文件中的数据。
  用户可扩展Hive支持更多的自定义格式化类。
  1. 在“InputFormat Class”填写输入数据使用的类“org.apache.hadoop.hive.ql.io.RCFileInputFormat”。
  2. 在“OutputFormat Class”填写输出数据使用的类“org.apache.hadoop.hive.ql.io.RCFileOutputFormat”。
选择一个文件保存位置，并单击“Next”。
默认勾选“Use default location”。如果需要自定义存储位置，请取消选中状态并在“External location”单击指定一个文件存储位置。
设置Hive表的字段。
1. 在“Column name”设置列的名称。
  支持字母、数字、下划线，首位必须为字母或数字，且长度不能超过128位。
2. 在“Column type”选择一个数据类型。
  单击“Add a column”可增加新的列。
3. 单击“Add a partition”为Hive表增加分区，可提高查询效率。
单击“Create Table”创建表，等待Hue显示Hive表的信息。