搜索_华为云

窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，性能较好。通常，窗口去重直接用于窗口表值函数上。另外，它可以用于基于窗口表值函数的操作。比如窗口聚合，窗口TopN和窗口关联。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
查询队列详情 - 数据湖探索 DLI

开通了企业管理服务的用户可设置该参数绑定指定的项目。 resource_type 否 String 资源类型。 vm：ecf集群 container：容器化集群（k8s） cu_spec 否 Integer 队列的规格大小。对于包周期队列，表示包周期部分的CU值；对于按需队列，表示用户购买队列时的初始值。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

"user_name":"Alice","area_id":"330106"} 按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

LAST_VALUE(expression) 返回一组有序值中的最后一个值。 LISTAGG(expression [, separator]) 连接字符串表达式的值并在它们之间放置分隔符值。字符串末尾不添加分隔符时则分隔符的默认值为“,”。父主题：内置函数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

2021-03-24 16:10:06,0001,Alice,330106 按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
队列相关 - 数据湖探索 DLI
队列相关 - 数据湖探索 DLI

out.println("defaultQueue is:"+ queue.getQueueName()); } 默认队列允许所有用户使用，DLI会限制用户使用默认队列的次数。查询所有队列 DLI提供查询队列列表接口，您可以使用该接口并选择相应的队列来执行作业。示例代码如下： 1 2

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Spark SQL常用配置项说明 - 数据湖探索 DLI

maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark.sql.dynamicPartitionOverwrite.enabled false 当

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
查询所有全局变量 - 数据湖探索 DLI

String 全局变量值。 project_id 否 String 项目ID。 user_id 否 String 用户ID。 user_name 否 String 用户名。 is_sensitive 否 Boolean 是否设置为敏感变量。 create_time 否 Long 创建时间。

帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

数据探索湖 > 队列监控 > 队列CU使用量” 。计算剩余CU量。队列剩余CU量=队列CU量 - 队列CU使用量。当队列剩余CU量小于用户提交的CU量，则需要等待资源，才能提交成功。父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
parse - 数据湖探索 DLI
parse - 数据湖探索 DLI

keyToExtract]) 参数说明表1 参数说明参数是否必选参数类型说明 urlString 是 STRING URL链接。无效URL链接会返回报错。 partToExtract 是 STRING 取值包含：HOST、PATH、QUERY、REF、PROTOCOL、A

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
查询所有队列 - 数据湖探索 DLI

enterprise_project_id 否 String 企业项目ID。0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 cidr_in_vpc 否 String 队列的虚拟私有云（VPC）的网段。例如：10.0

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
修改组或资源包拥有者（废弃） - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。请求消息表2 请求参数参数名称是否必选参数类型说明 new_owner 是 String 新用户名。名称只能包含数字、英文字母、下划线和中划线且不能以数字开头，长度在5-32字符之间。 group_name 是 String 组名。名

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
禁止或恢复表的生命周期 - 数据湖探索 DLI

周期后因使用之前的配置导致数据被误回收。 disable 否禁止表或指定分区的生命周期功能。禁止表本身及其所有分区被生命周期回收，优先级高于恢复表分区生命周期。即当使用禁止表或指定分区的生命周期功能时，设置待禁止或恢复生命周期的表的分区信息是无效的。禁止表的生命周期功能后，

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
创建数据库（废弃） - 数据湖探索 DLI

d 否 String 企业项目ID，“0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 tags 否 Array of Objects 数据库的标签。具体请参考表3。表3 tags参数

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 数据库相关API（废弃）
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

将表与表函数的结果进行 join 操作。左表（outer）中的每一行将会与调用表函数所产生的所有结果中相关联行进行 join 。注意事项针对横向表的左外部连接当前仅支持文本常量 TRUE 作为谓词。示例若表函数返回了空结果，左表（outer）的行将会被删除 SELECT users, tag

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

将表与表函数的结果进行 join 操作。左表（outer）中的每一行将会与调用表函数所产生的所有结果中相关联行进行 join 。注意事项针对横向表的左外部连接当前仅支持文本常量 TRUE 作为谓词。示例若表函数返回了空结果，左表（outer）的行将会被删除 SELECT users, tag

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

将表与表函数的结果进行 join 操作。左表（outer）中的每一行将会与调用表函数所产生的所有结果中相关联行进行 join 。注意事项针对横向表的左外部连接当前仅支持文本常量 TRUE 作为谓词。示例如果表函数返回了空结果，左表（outer）的行将会被删除 SELECT users, tag

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
在default队列执行DLI SQL失败，提示超时异常怎么办？ - 数据湖探索 DLI

Error message:Execution Timeout 问题原因 default队列是系统预置的默认公共队列，主要用来体验产品功能。当多个用户通过该队列提交作业时，容易发生流控，从而导致作业提交失败。解决方案建议不要使用default队列提交作业，可以在DLI控制台新购买SQL队列来提交作业。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
导出查询结果 - 数据湖探索 DLI

String 导出数据的编码格式。默认使用utf-8。支持以下编码格式： utf-8 gb2312 gbk quote_char 否 String 用户自定义引用字符。默认值: 英文双引号（"）仅在数据格式为csv格式时支持配置引用字符。引用字符在导出作业结果时用于标识文本字段的开始和结束，即用于分割字段。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Hudi表分区设计规范 - 数据湖探索 DLI

各个分区的数据量是会有波动的，分区下桶的个数设计一般会按照最大分区数据量计算，这样会出现越细粒度的分区，桶的个数会冗余越多。例如：采用天级分区，平均的日增数据量是3GB，最多一天的日志是8GB，这个会采用Bucket桶数= 8GB/2GB = 4 来创建表；每天的更新数据占比较

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范

总条数： 953

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

窗口去重 - 数据湖探索 DLI

查询队列详情 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

队列相关 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

查询所有全局变量 - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

parse - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

修改组或资源包拥有者（废弃） - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

创建数据库（废弃） - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

在default队列执行DLI SQL失败，提示超时异常怎么办？ - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线