搜索_华为云

基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

表生命周期 DLI表数据的生命周期管理功能（dli.lifecycle.days），指表（分区）数据从最后一次更新的时间算起，在经过指定的时间后没有变动，则此表（分区）DLI自动回收。这个指定的时间就是生命周期。生命周期管理功能方便您释放存储空间，简化回收数据的流程。同时提供数据备份与恢复功能，避免因误操作丢失数据。

帮助中心 > 数据湖探索 DLI > 产品介绍
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

测试，测试装载数据的时间，这项操作非常耗时。Power 测试是在数据装载测试完成后，数据库处于初始状态，未进行其它任何操作，特别是缓冲区还没有被测试数据库的数据，被称为raw查询。Power测试要求22 个查询顺序执行1 遍，同时执行一对RF1 和RF2 操作。最后进行Throughput

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
查询作业执行进度信息 - 数据湖探索 DLI

如果整个作业刚开始运行或者在提交中，则进度展示为0；如果作业运行结束，则进度展示为1。此时progress表示整个作业的运行进度，因为没有子作业在运行，sub_job_id不展示。如果有子作业在运行中，则展示该子作业的运行进度，progress的计算方法为：子作业已经完成的

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
创建并使用跨源链接 - 数据湖探索 DLI

"connection_id": "2a620c33-5609-40c9-affd-2b6453071b0f" } （可选）如果创建增强型跨源连接时，没有绑定队列，可使用绑定队列接口进行绑定。确认增强型跨源连接创建成功。接口相关信息 URI格式：GET /v2.0/{project_id

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

Caused by: java.net.SocketTimeoutException: connect timed out A：应考虑是跨源没有绑定，或者跨源没有绑定成功。参考增强型跨源连接章节，重新配置跨源。参考DLI跨源连接DWS失败进行问题排查。 Q：如果该DWS表在某schema下，则应该如何配置？

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

使用gsjdbc4驱动连接时，加载的数据库驱动类为：org.postgresql.Driver。该驱动为默认，创建表时可以不填该驱动参数。表car_info没有在schema下时。 1 2 3 4 5 6 7 8 9 10 11 12 create table dwsSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DWS维表（不推荐使用） - 数据湖探索 DLI

Caused by: java.net.SocketTimeoutException: connect timed out A：应考虑是跨源没有绑定，或者跨源没有绑定成功。参考增强型跨源连接章节，重新配置跨源。参考DLI跨源连接DWS失败进行问题排查。 Q：如果该DWS表在某schema下，则应该如何配置？

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

顺序分配，直到剩余的CU数分配完成。队列扩容成功后，系统开始对扩容的CU进行计费，直到缩容成功停止对扩容的CU计费。因此，要注意如果业务没有需求的情况下，要及时清理释放资源，否则不管CU是否真正的使用，都会一直计费。表1 弹性资源池扩缩容CU分配场景说明（无任务场景）场景弹性资源池CU数分配说明

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

DLI SDK简介 DLI SDK简介数据湖探索服务软件开发工具包（DLI SDK，Data Lake Insight Software Development Kit）是对DLI服务提供的REST API进行的作业提交的封装，以简化用户的开发工作。用户直接调用DLI SDK提供的接口函数即可实现使用提交DLI

帮助中心 > 数据湖探索 DLI > SDK参考
提交SQL作业（推荐） - 数据湖探索 DLI

参数名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.autoBroadcastJoinThreshold 209715200 配置执行连接时显示所有工作节点的表的

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

如果要在所有SQL队列上立即生效，需要分别选择SQL队列执行一遍：CREATE OR REPLACE xxx FUNCTION ...，否则没有执行的队列可能延迟0-12小时生效。如果当前运行的作业中使用自定义函数F1，该F1函数指定类名C1，程序包名J1，作业运行了一半后，重新修改J1程序包逻辑，CREATE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

如果当前队列有作业正在运行时，可能无法缩容到目标CU值，而是缩容到当前队列规格和目标规格中间的某个值，系统将在1小时后继续尝试进行缩容，直至下一个定时任务开始。当一个定时任务没有扩容或者缩容到目标CU值时，系统会在约15分钟后再次触发扩缩计划，直到下一个定时任务开始。创建弹性扩缩容定时任务如果只设定扩容或者缩容

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
FileSystem结果表 - 数据湖探索 DLI

件。在STREAMING模式下使用FileSink需要开启Checkpoint功能。Part文件只在Checkpoint成功时生成。如果没有开启Checkpoint功能，文件将永远停留在in-progress或者pending的状态，并且下游系统将不能安全读取该文件数据。 sink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

可使用，您只需要为您账号中的资源进行付费。关于IAM的详细介绍，请参见《IAM产品介绍》。 DLI权限默认情况下，管理员创建的IAM用户没有任何权限，您需要将其加入用户组，并给用户组授予策略或角色，才能使得该用户组中的用户获得对应的权限，这一过程称为授权。授权后，用户就可以基于被授予的权限对云服务进行操作。

帮助中心 > 数据湖探索 DLI > 产品介绍
Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表功能描述 DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

须指定 write.precombine.field 是无 String 数据合并字段基于此字段的大小来判断消息是否进行更新。如果您没有设置该参数，则系统默认会按照消息在引擎内部处理的先后顺序进行更新。 write.payload.class 否无 String write

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
对象存储OBS结果表 - 数据湖探索 DLI

连接器在STREAMING模式下使用FileSink需要开启Checkpoint功能。Part文件只在Checkpoint成功时生成。如果没有开启Checkpoint功能，文件将永远停留在in-progress或者pending的状态，并且下游系统将不能安全读取该文件数据。 sink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
DLI自定义策略 - 数据湖探索 DLI

格式为：服务名:资源类型:操作，例：dli:queue:submit_job。服务名为产品名称，例如dli、evs和vpc等，服务名仅支持小写。资源类型和操作没有大小写，要求支持通配符号*，无需罗列全部授权项。资源类型可以参考表4中的资源类型。操作：操作以IAM服务中已经注册的action为准。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

的每个子列表可以是空的，多列或表达式，它们的解释方式和直接使用 GROUP BY 子句是一样的。一个空的 Grouping Sets 表示所有行都聚合在一个分组下，即使没有数据，也会输出结果。对于 Grouping Sets 中的空子列表，结果数据中的分组或表达式列会用NULL代替。例如，上例中的 GROUPING

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口

总条数： 217

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

基本概念 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线