搜索_华为云

如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
清理多版本数据 - 数据湖探索 DLI

数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。时间戳删除该时间戳时间点之前的多版本数据。时间格式需要为yyyy-MM-dd HH:mm:ss 注意事项 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
查看Flink作业详情 - 数据湖探索 DLI

作业的状态信息。具体状态信息以控制台为准。描述所提交Flink作业的描述。用户名提交作业的用户名称。创建时间每个作业的创建时间。开始时间 Flink作业开始运行的时间。运行时长作业运行所消耗的时间。操作编辑：编辑已经创建好的作业。启动：启动作业并运行。更多 FlinkUI：单击

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
to_date1 - 数据湖探索 DLI
to_date1 - 数据湖探索 DLI

to_date1 to_date1函数用于将指定格式的字符串转换为日期值。相似函数：to_date，to_date函数用于返回时间中的年月日，不支持指定转换的日期格式。命令格式 to_date1(string date, string format) 参数说明表1 参数说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

个任务并行读取时如何对表进行分区。 scan.partition.column：用于对输入进行分区的列名，该列的数据类型必须是数字，日期或时间戳。 scan.partition.num: 分区数。 scan.partition.lower-bound：第一个分区的最小值。 scan

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
DWS维表（不推荐使用） - 数据湖探索 DLI

lookup.cache.ttl 否无 Duration 维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length value}{time unit label}，如123ms, 321s，支持的时间单位包括: d,h,min,s,ms等，默认为ms。默认表示不使用该配置。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

更高的值意味着达到边界需要更长的时间，但可能会有更多的请求排队，并使用更多的堆空间。默认请设置为2147483647。 connection-timeout-millis 否 10000 Integer 尝试连接redis集群时的最大超时时间。 commands-timeout-millis

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

lookup.cache.ttl 否 -1 Long 维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length value}{time unit label}，如123ms, 321s，支持的时间单位包括: d,h,min,s,ms等，默认为ms。默认表示不使用该配置。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

lookup.cache.ttl 否 -1 Long 维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length value}{time unit label}，如123ms, 321s，支持的时间单位包括: d,h,min,s,ms等，默认为ms。默认表示不使用该配置。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Elasticsearch结果表 - 数据湖探索 DLI

对于EXPONENTIAL退避，这是初始基本延迟。 connection.max-retry-timeout 否无 Duration 重试之间的最大超时时间。 connection.path-prefix 否无 String 要添加到每个REST通信的前缀字符串，例如， '/v1'。 format

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

no-ttl：不设置过期时间。 expire-msec：设置key多久过期，参数为long类型字符串，单位为毫秒。 expire-at-date：设置key到某个时间点过期，参数为UTC时间。 expire-at-timestamp：设置key到某个时间点过期，参数为时间戳。 key-ttl

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

lookup.cache.ttl 否无 Duration 维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length value}{time unit label}，如123ms, 321s，支持的时间单位包括: d,h,min,s,ms等，默认为ms。默认表示不使用该配置。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Hudi数据表Clean规范 - 数据湖探索 DLI

rquet文件读增量数据，性能会有下降；如果保留时间过长，会导致log里面的历史数据冗余存储。具体可以按照下面的计算公式来保留2个小时的历史版本数据：版本数设置为3600*2/版本interval时间，版本interval时间来自于flink作业的checkpoint周期，或者上游批量写入的周期。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

更高的值意味着达到边界需要更长的时间，但可能会有更多的请求排队，并使用更多的堆空间。默认请设置为2147483647。 connection-timeout-millis 否 10000 Integer 尝试连接redis集群时的最大超时时间。 commands-timeout-millis

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
管理Spark作业模板 - 数据湖探索 DLI

管理Spark作业模板操作场景在创建Spark作业时，您可以在已有的Spark样例模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。当前云平台尚未提供预置的Spark模板，但支持用户自定义Spark作业模板，本节操作介绍在Spark管理页面创建Spark模板的操作方法。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
窗口关联 - 数据湖探索 DLI
窗口关联 - 数据湖探索 DLI

和相同滚动窗口的数据会被关联在一起。这里给出一个基于 TUMBLE Window TVF 的窗口连接的例子。在下面的例子中，通过将 join 的时间区域限定为固定的 5 分钟，数据集被分成两个不同的时间窗口：[12:00,12:05) 和 [12:05,12:10)。L2 和 R2 不能 join 在一起是因为它们不在一个窗口中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的列必须为时间属性。目前仅支持proctime。升序（ ASC ）排列指只保留第一行，而降序排列（ DESC ）则只保留最后一行。 WHERE rownum

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的列必须为时间属性。目前仅支持proctime。升序（ ASC ）排列指只保留第一行，而降序排列（ DESC ）则只保留最后一行。 WHERE rownum

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
管理Flink作业模板 - 数据湖探索 DLI

SQL作业模板 Flink OpenSource SQL作业模板描述模板的相关描述，且长度为0～512个字符。创建时间创建模板的时间。更新时间最后修改模板的时间。操作 “编辑”：对已经创建好的模板进行修改。 “创建作业”：直接在该模板下创建作业，创建完后，系统跳转到“作业管理”下的作业编辑页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

no-ttl：不设置过期时间。 expire-msec：设置key多久过期，参数为long类型字符串，单位为毫秒。 expire-at-date：设置key到某个时间点过期，参数为UTC时间。 expire-at-timestamp：设置key到某个时间点过期，参数为时间戳。 key-ttl

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis

总条数： 460

上一页
1
...
11
12
13
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何合并小文件 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

to_date1 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

窗口关联 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线