数据仓库服务 GaussDB(DWS)-做结果表:Flink SQL配置参数
Flink SQL配置参数
Flink SQL中设置的PRIMARY KEY将自动映射到dws-client中的uniqueKeys。参数跟随client版本发布,参数功能与client一致,以下参数说明表示为最新参数。
参数 |
说明 |
默认值 |
---|---|---|
connector |
flink框架区分connector参数,固定为dws。 |
- |
url |
数据库连接地址。 |
- |
username |
配置连接用户。 |
- |
password |
配置密码。 |
- |
tableName |
对应dws表。 |
- |
参数 |
说明 |
默认值 |
---|---|---|
connectionSize |
初始dws-client时的并发数量。 |
1 |
connectionMaxUseTimeSeconds |
连接创建多少秒后强制释放(单位:秒)。 |
3600(一小时) |
connectionMaxIdleMs |
连接最大空闲时间,超过后将释放(单位:毫秒)。 |
60000(一分钟) |
dws client参数全量支持在flink sql通过key方式配置,下表参数为兼容1.x版本参数,当同时配置2.x和1.x参数时生效2.x版本参数值:
参数 |
说明 |
默认值 |
---|---|---|
conflictStrategy |
有主键表数据写入时主键冲突策略:
|
update |
writeMode |
入库方式:
|
auto |
maxFlushRetryTimes |
在入库时最大尝试次数,次数内执行成功则不抛出异常,每次重试间隔为 1秒 * 次数。 |
3 |
autoFlushBatchSize |
自动刷库的批大小(攒批大小)。 |
5000 |
autoFlushMaxInterval |
自动刷库的最大间隔时间(攒批时长)。 |
5s |
copyWriteBatchSize |
在“writeMode == auto”下,使用copy的批大小。 |
5000 |
metadataCacheSeconds |
系统中对元数据的最大缓存时间,例如表定义信息(单位秒)。 |
180 |
copyMode |
copy入库格式:
|
CSV |
createTempTableMode |
创建临时表方式:
|
AS |
numberAsEpochMsForDatetime |
如果数据库为时间类型数据源为数字类型,是否将数据当成时间戳转换为对应时间类型。 |
false |
stringToDatetimeFormat |
如果数据库为时间类型数据源为字符串类型,按该格式转换为时间类型,该参数配置即开启。 |
null |
参数 |
说明 |
默认值 |
---|---|---|
ignoreDelete |
忽略flink任务中的delete。 |
false (1.0.10前默认true) |
ignoreNullWhenUpdate |
是否忽略flink中字段值为null的更新,只有在“conflictStrategy == update”时有效。 |
false |
sink.parallelism |
flink系统参数用于设置sink并发数量。 |
跟随上游算子 |
printDataPk |
是否在connector接收到数据时打印数据主键,用于排查问题。 |
false |
ignoreUpdateBefore |
忽略flink任务中的update_before,在大表局部更新时该参数一定打开,否则有update时会导致数据的其它列被设置为null,因为会先删除再写入数据。 |
true |
- 数据仓库服务GaussDB(DWS)_SQL on Anywhere
- GaussDB(DWS)常用SQL_常用SQL命令_SQL语法
- 调用GaussDB(DWS) API接口_数据仓库服务调用API_如何调用API_在DWS中调用API
- 什么是数据湖探索服务_数据湖探索DLI用途与特点
- 大数据应用范围有哪些_大数据技术与应用要学习什么课程
- DWS产品介绍_DWS产品优势_DWS功能_DWS使用场景_DWS是什么
- DWS安全_数据仓库服务安全_DWS数据安全管理_DWS安全保障_DWS安全策略
- 什么是Flink OpenSource SQL_数据湖探索_Flink OpenSource SQL
- 数据治理中心_数据开发_数据开发示例_使用教程-华为云
- GAUSS(DWS)工具_gsql工具_DataStudio工具_DSC工具