搜索_华为云

SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

BY进行分组，再在HAVING子句中进行过滤，HAVING子句支持算术运算，聚合函数等。注意事项如果过滤条件受GROUP BY的查询结果影响，则不能用WHERE子句进行过滤，而要用HAVING子句进行过滤。示例根据字段name对表student进行分组，再按组将score最大值大于95的记录筛选出来。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

BY进行分组，再在HAVING子句中进行过滤，HAVING子句支持算术运算，聚合函数等。注意事项如果过滤条件受GROUP BY的查询结果影响，则不能用WHERE子句进行过滤，而要用HAVING子句进行过滤。示例根据字段name对表student进行分组，再按组将score最大值大于95的记录筛选出来。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Hudi表索引设计规范 - 数据湖探索 DLI

比较高，不受表的数据量限制。Flink和Spark引擎都支持，Flink和Spark引擎可以实现交叉混写同一张表。缺点：Bucket个数不能动态调整，数据量波动和整表数据量持续上涨会导致单个Bucket数据量过大出现大数据文件。需要结合分区表来进行平衡改善。 Flink状态索引

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对kafka消息进行过滤，则可以考虑先实时接入生成offset，再truncate table ，再历史导入，再开启实时。图1 初始化操作流程

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ DLI和MRS都支持Spark组件，但在服务模式、接口方式、应用场景和性能特性上存在一些差异。 DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
开启Flink作业动态扩缩容 - 数据湖探索 DLI

在Flink作业进行动态扩缩容时如果队列资源被抢占，剩余资源不满足作业启动所需资源则可能存在作业无法正常恢复的情况。在Flink作业进行动态扩缩时后台作业需要停止继而从savepoint恢复，因此未恢复成功前，作业无法处理数据。因扩缩容过程中需要触发savepoint，因此必须配置obs桶，并

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
查看弹性资源池的基本信息 - 数据湖探索 DLI

实际CUs的计算公式：实际CUs=min{sum（队列maxCU）,弹性资源池maxCU}。计算结果需满足为16CUs的倍数，如果不能整除16CUs则向上取整。实际CUs的分配示例：如表1所示，弹性资源池实际CUs分配的计算过程如下：计算队列maxCU之和：sum（队列maxCU）=

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

之间的比较）。系统采样中行的选择依赖于使用的connector。例如，如果使用Hive数据源，这将取决于数据在OBS上的布局。这种采样方法不能保证独立的抽样概率。 SELECT * FROM users TABLESAMPLE SYSTEM (75); 父主题： DQL 语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Flink作业概述 - 数据湖探索 DLI
Flink作业概述 - 数据湖探索 DLI

DLI允许用户提交编译为Jar包的Flink作业，提供了更高的灵活性和自定义能力，适合需要进行复杂数据处理的场景。当社区版Flink提供的Connector不能满足特定需求时，用户可以通过Jar作业来实现自定义的Connector或数据处理逻辑。适合需要实现UDF（用户定义函数）或特定库集成的场

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
CREATE SCHEMA - 数据湖探索 DLI
CREATE SCHEMA - 数据湖探索 DLI

示例创建一个名为web的schema： CREATE SCHEMA web; 在指定路径创建schema，路径必须是obs的并行桶，路径末尾不能加/，指定路径兼容写法示例： CREATE SCHEMA test_schema_5 LOCATION 'obs://${bucket}/user/hive';

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
HAVING - 数据湖探索 DLI
HAVING - 数据湖探索 DLI

等式操作符，及IN，NOT IN操作符。注意事项所要查询的表必须是已经存在的表，否则会出错。此处的sub_query与聚合函数的位置不能左右互换。示例对表student_info按字段name进行分组，计算每组中记录数，若其记录数等于子查询中表course_info的记

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
创建表时指定表的生命周期 - 数据湖探索 DLI

生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。生命周期设置后，DLI表和OBS表支持数据备份，OBS表的备份目录需要手工设置。且备份目录应选择在并行文件系统上，备份目录必须和原表目录在同一个桶上，备份目录不能与原表相同目录或者子目录同名。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
创建DLI自定义委托权限 - 数据湖探索 DLI

3及以上版本的引擎执行作业时，需要在作业配置中添加新建的委托信息。否则Spark3.3.1作业不指定委托时，无法使用OBS；Flink1.15作业不指定委托时，无法开启checkpoint、savepoint，作业提交日志无法转储，无法使用OBS、DWS等数据源。仅有运行在弹性资源池队列上的Flink 1.15和Spark3

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
审计与日志 - 数据湖探索 DLI
审计与日志 - 数据湖探索 DLI

Service，CTS），是华为云安全解决方案中专业的日志审计服务，提供对各种云资源操作记录的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 CTS可记录的DLI操作列表详见云审计服务支持的DLI操作列表说明。用户开通云审计服务并创建和配置追踪器后，CTS开始记录操作事件

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
管理DLI全局变量 - 数据湖探索 DLI

用户均可删除该全局变量。变量删除后，SQL中将无法使用该变量。全局变量权限管理针对不同用户，可以通过权限设置分配不同的全局变量，不同用户之间互不影响。管理员用户和全局变量的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其全局变量权限。给新用户设置全局变量权限时，

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
CLUSTERING - 数据湖探索 DLI
CLUSTERING - 数据湖探索 DLI

predicate => "dt = '2021-08-28'", order => 'id'); 注意事项 table与path参数必须存在一个，否则无法判断需要执行clustering的表。使用由DLI提供的元数据服务时，本命令仅支持配置table参数，不支持配置path参数。如果需要

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
ALTER VIEW - 数据湖探索 DLI
ALTER VIEW - 数据湖探索 DLI

关联查询为select * from V limit 10，则最终只有5条数据返回。限制以上两种语法不可混用。当视图包含分区，那么将无法通过这个语法来改变定义。示例 CREATE OR REPLACE VIEW tv_view as SELECT id,name from

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
FileSytem结果表 - 数据湖探索 DLI

file-path' = '', 'format.type' = '' ); 注意事项该建表语法的数据输出目录为OBS时，OBS必须为并行文件系统，不能为OBS桶。使用fileSystem时必须开启checkpoint，保证作业的一致性。 format.type为parquet时，支持的数据类型为string

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

当清理策略为KEEP_ARCHIVED_FILES_BY_DAYS时，该参数可以设置保留多少天以内的归档文件，默认值30（天）。注意事项归档文件，没有备份，删除之后无法恢复。使用由DLI提供的元数据服务时，本命令不支持使用OBS路径。系统响应可以检查任务状态是否成功，查看任务日志确认有无异常。父主题：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Json函数和运算符 - 数据湖探索 DLI

'[1,23,456]' AS ARRAY(INTEGER)); -- [1, 23, 456] JSON函数 NULL到JSON的转换并不能简单地实现。从独立的NULL进行转换将产生一个SQLNULL，而不是JSON 'null'。不过，在从包含NULL的数组或Map进行转换时，生成的JSON将包含NULL。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符

总条数： 677

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

Flink作业概述 - 数据湖探索 DLI

CREATE SCHEMA - 数据湖探索 DLI

HAVING - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

审计与日志 - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

CLUSTERING - 数据湖探索 DLI

ALTER VIEW - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线