MAPREDUCE服务 MRS-在Hue WebUI使用元数据浏览器:手工创建一个Hive表

时间:2024-06-29 16:25:20

手工创建一个Hive表

  1. 访问“Metastore Manager”,在“Databases”选择一个数据库。

    默认数据库为“default”

  2. 单击,进入“Create a new table manually”页面。
  3. 设置表名称。

    1. “Table Name”填写Hive表的名称。

      支持字母、数字、下划线,首位必须为字母或数字,且长度不能超过128位。

    2. 根据需要,在“Description”填写Hive表的描述信息。
    3. 单击“Next”

  4. 选择一个存储数据的格式。

    • 需要使用分隔符分隔数据时,选择“Delimited”,然后执行5
    • 需要使用序列化格式保存数据时,选择“SerDe”,执行6

  5. 配置分隔符。

    1. “Field terminator”设置一个列分隔符。

      如果分隔符不在列表中,选择“Other..”,然后输入新定义的分隔符。

    2. “Collection terminator”设置一个分隔符,用于分隔Hive中类型为“array”的列的数据集合。例如一个列为array类型,其中一个值需要保存“employee”“manager”,用户指定分隔符为“:”,则最终的值为“employee:manager”
    3. “Map key terminator”设置一个分隔符,用于分隔Hive中类型为“map”的列的数据。例如某个列为map类型,其中一个值需要保存描述为“aaa”“home”,和描述为“bbb”“company”,用户指定分隔符为“|”,则最终的值为“home|aaa:company|bbb”
    4. 单击“Next”,执行7

  6. 设置序列化属性。

    1. “SerDe Name”输入序列化格式的类名称“org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe”

      用户可扩展Hive支持更多自定义的序列化类。

    2. “Serde properties”输入序列化的样式的值:“"field.delim"="," "colelction.delim"=":" "mapkey.delim"="|"”
    3. 单击“Next”,执行7

  7. 选择一个数据表的格式,并单击“Next”

    • “TextFile”表示使用文本类型文件存储数据。
    • “SequenceFile”表示使用二进制类型文件存储数据。
    • “InputFormat”表示使用自定义的输入输出格式来使用文件中的数据。
      用户可扩展Hive支持更多的自定义格式化类。
      1. “InputFormat Class”填写输入数据使用的类“org.apache.hadoop.hive.ql.io.RCFileInputFormat”
      2. “OutputFormat Class”填写输出数据使用的类“org.apache.hadoop.hive.ql.io.RCFileOutputFormat”

  8. 选择一个文件保存位置,并单击“Next”

    默认勾选“Use default location”。如果需要自定义存储位置,请取消选中状态并在“External location”单击指定一个文件存储位置。

  9. 设置Hive表的字段。

    1. “Column name”设置列的名称。

      支持字母、数字、下划线,首位必须为字母或数字,且长度不能超过128位。

    2. “Column type”选择一个数据类型。

      单击“Add a column”可增加新的列。

    3. 单击“Add a partition”为Hive表增加分区,可提高查询效率。

  10. 单击“Create Table”创建表,等待Hue显示Hive表的信息。
support.huaweicloud.com/cmpntguide-mrs/mrs_01_0372.html