搜索_华为云

配置SQL防御规则 - 数据湖探索 DLI

说明类别适用引擎支持的动作取值说明系统默认创建规则 SQL语句示例 dynamic_0001 Scan files number 扫描文件数的限制。 dynamic spark HetuEngine 提示拦截取值范围：1-2000000 默认值：200000 是 NA

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
预览SQL作业查询结果 - 数据湖探索 DLI

目前仅支持查看“QUERY”类型作业的执行结果。 row_count 否 Integer 作业结果总条数。 input_size 否 long 作业执行过程中扫描的数据量。 schema 否 Array of Map 作业结果列名称和类型。 rows 否 Array of Objects 作业结果集。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

Serverless DLI与传统自建Hadoop集群对比的优势优势维度数据湖探索 DLI 自建Hadoop系统低成本资金成本按照实际扫描数据量或者CU时收费，可变成本，成本可节约50%。长期占用资源，资源浪费严重，成本高。弹性扩缩容能力基于容器化Kubernetes，具有极致的弹性伸缩能力。

帮助中心 > 数据湖探索 DLI > 产品介绍
禁止或恢复表的生命周期 - 数据湖探索 DLI

恢复表或指定分区的生命周期功能表及其分区重新参与生命周期回收，默认使用当前表及分区上的生命周期配置。开启表生命周期前可以修改表及分区的生命周期配置，防止开启表生命周期后因使用之前的配置导致数据被误回收。 disable 否禁止表或指定分区的生命周期功能。禁止表本身及其所有分区被生命周期

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

kyuubi.operation.incremental.collect kyuubi会预加载select结果数据到缓存加快读取数据，数据量较大的场景防止内存OOM建议关闭。否 false 配置为false代表关闭预加载。 kyuubi.engine.jdbc.memory jdbc engine进程内存

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
查询队列详情 - 数据湖探索 DLI

与该队列绑定的计算单元数。即当前队列的CU数。 chargingMode 否 integer 队列的收费模式。 0：系统默认default队列。按照扫描量计费。 1：表示按照CU时收费。 2：表示按照包年包月收费。 resource_id 否 String 队列的资源ID。 resource_mode

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

组持续的时间，持续时间较短的 group 窗口不会产生状态过大的问题。可以提供一个合适的状态 time-to-live (TTL) 配置来防止状态过大。注意：这可能会影响查询结果的正确性。更多介绍和使用请参考开源社区文档：分组聚合。 DISTINCT 聚合 DISTINCT 聚

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
DLI弹性资源池与队列简介 - 数据湖探索 DLI

购买弹性资源池并在弹性资源池中添加队列的具体操作步骤请参考创建弹性资源池并添加队列。全局共享模式：全局共享模式是一种根据SQL查询中实际扫描的数据量来分配计算资源的模式，不支持指定或预留计算资源。 DLI服务预置的“default”队列即为全局共享模式的计算资源，资源的大小是按

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Spark SQL常用配置项说明 - 数据湖探索 DLI

dynamicPartitionPruning.enabled true 该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN Product ON Orders.productId

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN Product ON Orders.productId

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN Product ON Orders.productId

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

initial String 消费数据时的启动模式。 initial（默认）：在第一次启动时，会先扫描历史全量数据，然后读取最新的Binlog数据。 latest-offset：在第一次启动时，不会扫描历史全量数据，直接从Binlog的末尾（最新的Binlog处）开始读取，即只读取该Connector启动以后的最新变更。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
状态码 - 数据湖探索 DLI
状态码 - 数据湖探索 DLI

中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大，服务器无法处理，因此拒绝请求。为防止客户端的连续请求，服务器可能会关闭连接。如果只是服务器暂时无法处理，则会包含一个Retry-After的响应信息。 414 Request-URI

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
比较函数 - 数据湖探索 DLI
比较函数 - 数据湖探索 DLI

和分组操作中可以被重写的操作。对于流式查询，该操作在 join 和分组操作中被重写。根据输入行的数量计算查询结果所需的状态可能会无限增长。请提供具有有效保留间隔的查询配置，以防止状态过大。 value IN (sub-query) BOOLEAN 如果 value 等于子查询结果集中的一行则返回 TRUE。 value

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
查询所有队列 - 数据湖探索 DLI

与该队列绑定的计算单元数，即当前队列的CU数。 charging_mode 否 Integer 队列的收费模式。 0：系统默认default队列。按照扫描量计费。 1：表示按照CU时收费。 2：表示按照包年包月收费。 resource_id 否 String 队列的资源ID。 enterprise_project_id

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
Hudi常见配置参数 - 数据湖探索 DLI

个文件中的记录总数约为130K。默认值（60000）大约是此近似值的一半。注意：将此值设置得太低，将产生很多误报，并且索引查找将必须扫描比其所需的更多的文件；如果将其设置得非常高，将线性增加每个数据文件的大小（每50000个条目大约4KB）。 60000 hoodie.index

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

关联，以确定是否找到匹配项。将最新的Hive表用作时间表不需要任何额外的配置。使用以下属性配置Hive表缓存的TTL。在缓存过期后，将重新扫描Hive表以加载最新的数据。参数默认值类型说明 lookup.join.cache.ttl 60 min Duration 查找连接中构建表的缓存

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

overwrite这样幂等的语法而不是insert into等非幂等语法插入数据。如果严格需求数据不能重复，建议在insert into后对表数据执行去重操作，防止数据重复。父主题：数据相关

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
提交SQL作业（推荐） - 数据湖探索 DLI

dynamicPartitionPruning.enabled true 该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API

总条数： 74

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置SQL防御规则 - 数据湖探索 DLI

预览SQL作业查询结果 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

查询队列详情 - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

状态码 - 数据湖探索 DLI

比较函数 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线