湖仓构建 LAKEFORMATION-批量设置分区的统计信息:请求参数

时间:2024-10-22 17:23:06

请求参数

表2 请求Header参数

参数

是否必选

参数类型

描述

X-Auth-Token

Array of strings

租户token。

表3 请求Body参数

参数

是否必选

参数类型

描述

need_merge

Boolean

是否合入原有统计信息。

statistics

Array of PartitionColumnStatistics objects

分区统计信息的统计列表。

表4 PartitionColumnStatistics

参数

是否必选

参数类型

描述

column_statistics_desc

PartitionColumnStatisticsDescription object

列统计信息描述。

column_statistics_objects

Array of ColumnStatisticsObj objects

列统计信息。

表5 PartitionColumnStatisticsDescription

参数

是否必选

参数类型

描述

partition_values

Array of strings

分区值的列表。

last_analyzed_time

String

最后统计时间。

表6 ColumnStatisticsObj

参数

是否必选

参数类型

描述

column_name

String

列名称。只能包含中文、字母、数字和_-+*(), 特殊字符,且长度为1~767个字符。

column_type

String

数据类型,字段类型包括array bigint binary boolean char date decimal double float int interval map set smallint string struct timestamp tinyint union varchar

data_type

String

统计信息类型:binaryStats、booleanStats、dateStats、decimalStats、doubleStats、longStats、stringStats。

枚举值:

  • binaryStats

  • booleanStats

  • dateStats

  • decimalStats

  • doubleStats

  • longStats

  • stringStats

binary_statistics_data

BinaryColumnStatisticsData object

字节数组类型统计信息。

long_statistics_data

LongColumnStatisticsData object

长整数类型统计信息。

decimal_statistics_data

DecimalColumnStatisticsData object

小数类型统计信息。

string_statistics_data

StringColumnStatisticsData object

字符串类型统计信息。

double_statistics_data

DoubleColumnStatisticsData object

浮点数类型统计信息。

date_statistics_data

DateColumnStatisticsData object

日期类型统计信息。

boolean_statistics_data

BooleanColumnStatisticsData object

布尔类型统计信息。

表7 BinaryColumnStatisticsData

参数

是否必选

参数类型

描述

maximum_length

Long

列中字节数组的最大值。

average_length

Double

列中字节数组的平均长度。

number_of_null

Long

列中空值个数。

表8 LongColumnStatisticsData

参数

是否必选

参数类型

描述

minimum_value

Long

列中长整数最小值。

maximum_value

Long

列中长整数最大值。

number_of_null

Long

列中空值个数。

number_of_distinct_value

Long

列中去重后的长整数个数。

bit_vector

String

估算唯一值使用的位图。

表9 DecimalColumnStatisticsData

参数

是否必选

参数类型

描述

minimum_value

Decimal object

列中小数最小值。

maximum_value

Decimal object

列中小数最大值。

number_of_null

Long

列中空值个数。

number_of_distinct_value

Long

列中去重后的小数个数。

bit_vector

String

估算唯一值使用的位图。

表10 Decimal

参数

是否必选

参数类型

描述

scale

Integer

整数部分。

unscaled

String

小数部分。

表11 StringColumnStatisticsData

参数

是否必选

参数类型

描述

average_length

Double

列中字符串平均长度。

maximum_length

Long

列中字符串最长长度。

number_of_null

Long

列中空值个数。

number_of_distinct_value

Long

列中去重后字符串个数。

bit_vector

String

估算唯一值使用的位图。

表12 DoubleColumnStatisticsData

参数

是否必选

参数类型

描述

minimum_value

Double

列中浮点数最小值。

maximum_value

Double

列中浮点数最大值。

number_of_null

Long

列中空值个数。

number_of_distinct_value

Long

列中去重后浮点数个数。

bit_vector

String

估算唯一值使用的位图。

表13 DateColumnStatisticsData

参数

是否必选

参数类型

描述

minimum_value

String

列中的最小时间戳。

maximum_value

String

列中的最大时间戳。

number_of_null

Long

列中空值个数。

number_of_distinct_value

Long

列中去重后的时间戳个数。

bit_vector

String

估算唯一值使用的位图。

表14 BooleanColumnStatisticsData

参数

是否必选

参数类型

描述

number_of_true

Long

列中为真的数量。

number_of_false

Long

列中为假的数量。

number_of_null

Long

列中为空的数量。

support.huaweicloud.com/api-lakeformation/SetPartitionColumnStatistics.html