数据湖探索 DLI-DataGen:参数说明

时间:2024-11-16 13:21:44

参数说明

表2 参数说明

参数

是否必选

默认值

数据类型

参数说明

connector

String

指定要使用的连接器,这里是'datagen'。

rows-per-second

10000

Long

每秒生成的行数,用以控制数据发出速率。

number-of-rows

Long

生成数据的总行数。默认条件下,不限制生成数据的总行数。如果有字段生成器类型为序列生成器,则当生成数据的行数达到上限或者序列数字达到结束值时,都不会再生成数据。

fields.#.kind

random

String

指定 '#' 字段的生成器。 '#' 字段必须是DataGen表中的字段,实际使用时需要将'#'替换为相应字段名。其他各参数的'#'号意义相同,不再重复描述。

参数值可以是 'sequence' 或 'random',具体含义如下:

  • random是默认值,表示无界的随机生成器。您可以通过“fields.#.max”和“fields.#.min”参数指定随机生成数的最大和最小值。当指定的字段类型为char、varchar、string时,可以通过“fields.#.length”参数指定长度。当指定的字段类型为时间戳类型时,可以通过“fields.#.max-past”参数指定相对当前时间向过去偏移的最大值。
  • sequence表示有界的序列生成器。您可以通过“fields.#.start”和“fields.#.end”指定序列的起始和结束值,当序列数字达到结束值时,就不会再生成数据。

fields.#.min

'#'号指定的字段类型的最小值

'#'号指定的字段类型

当“fields.#.kind”字段为:random时有效。

表示随机生成器的最小值,'#' 指定的字段仅适用于数字类型。

fields.#.max

'#'号指定的字段类型的最大值

'#'号指定的字段类型

当“fields.#.kind”字段为:random时有效。

随机生成数的最大值,'#' 指定的字段仅适用于数字类型。

fields.#.max-past

0

Duration

当“fields.#.kind”字段为:random时有效。

随机生成器生成相对当前时间向过去偏移的最大值,'#' 指定的字段仅适用于时间戳类型。

fields.#.length

100

Integer

当“fields.#.kind”字段为:random时有效。

随机生成器生成字符的长度,'#' 指定的字段仅适用于char、varchar、string。

fields.#.start

'#'号指定的字段类型

当“fields.#.kind”字段为:sequence时有效。

序列生成器的起始值。

fields.#.end

'#'号指定的字段类型

当“fields.#.kind”字段为:sequence时有效。

序列生成器的结束值。

support.huaweicloud.com/sqlref-flink-dli/dli_08_15031.html