MapReduce服务 MRS-新建CarbonData Table:使用自定义列创建表

时间：2025-02-12 14:58:21

MapReduce服务 MRS

可通过指定各列及其数据类型来创建表。

命令示例：

CREATE TABLE IF NOT EXISTS productdb.productSalesTable (

productNumber Int,

productName String,

storeCity String,

storeProvince String,

productCategory String,

productBatch String,

saleQuantity Int,

revenue Int)

STORED AS carbondata

TBLPROPERTIES (

'table_blocksize'='128');

上述命令所创建的表的详细信息如下：

表1 表信息定义
参数	描述
productSalesTable	待创建的表的名称。该表用于加载数据进行分析。表名由字母、数字、下划线组成。
productdb	数据库名称。该数据库将与其中的表保持逻辑连接以便于识别和管理。数据库名称由字母、数字、下划线组成。
productName storeCity storeProvince procuctCategory productBatch saleQuantity revenue	表中的列，代表执行分析所需的业务实体。列名（字段名）由字母、数字、下划线组成。
table_blocksize	CarbonData表使用的数据文件的block大小，默认值为1024，最小值为1，最大值为2048，单位为MB。如果“table_blocksize”值太小，数据加载时，生成过多的小数据文件，可能会影响HDFS的使用性能。如果“table_blocksize”值太大，数据查询时，索引匹配的block数据量较大，某些block会包含较多的blocklet，导致读取并发度不高，从而降低查询性能。一般情况下，建议根据数据量级别来选择大小。例如：GB级别用256，TB级别用512，PB级别用1024。