搜索_华为云

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业操作场景在Linux或Windows环境下您可以使用JDBC应用程序连接DLI服务端提交作业。使用JDBC连接DLI提交的作业运行在Spark引擎上。 JDBC版本2.X版本功能重构后，仅支持从DLI作业桶读取查询结果，如需使用该特性需具备以下条件：

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
HAVING - 数据湖探索 DLI
HAVING - 数据湖探索 DLI

等式操作符，及IN，NOT IN操作符。注意事项所要查询的表必须是已经存在的表，否则会出错。此处的sub_query与聚合函数的位置不能左右互换。示例对表student_info按字段name进行分组，计算每组中记录数，若其记录数等于子查询中表course_info的记

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
创建DLI自定义委托权限 - 数据湖探索 DLI

3及以上版本的引擎执行作业时，需要在作业配置中添加新建的委托信息。否则Spark3.3.1作业不指定委托时，无法使用OBS；Flink1.15作业不指定委托时，无法开启checkpoint、savepoint，作业提交日志无法转储，无法使用OBS、DWS等数据源。仅有运行在弹性资源池队列上的Flink 1.15和Spark3

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

r); } 重载方法的参数，可以设置为“null”，表示不设置过滤条件。同时也要注意参数的合法性，例如分页参数设置为“-1”，会导致查询失败。该SDK接口不支持sql_pattern，即通过指定sql片段作为作业过滤条件进行查询。如果需要则可以通过查询所有作业API接口指定该参数进行查询。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

页面中查看作业的实例信息，并根据需要对实例进行更多操作。了解更多实例监控。图19 设置实例监控常见问题如果 DataArts 作业失败，且 DataArts 提供的日志不够详细，怎么办？还能从哪里找更具体的日志？您可以可通过 DataArts 的日志找到 DLI job id，然后根据

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
对象存储OBS结果表 - 数据湖探索 DLI

point成功时生成。如果没有开启Checkpoint功能，文件将永远停留在in-progress或者pending的状态，并且下游系统将不能安全读取该文件数据。 sink end算子的接受记录数为checkpoint的个数，非实际的发送数据，实际发送数据量请参考streamin

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对kafka消息进行过滤，则可以考虑先实时接入生成offset，再truncate table ，再历史导入，再开启实时。图1 初始化操作流程

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
开启Flink作业动态扩缩容 - 数据湖探索 DLI

在Flink作业进行动态扩缩容时如果队列资源被抢占，剩余资源不满足作业启动所需资源则可能存在作业无法正常恢复的情况。在Flink作业进行动态扩缩时后台作业需要停止继而从savepoint恢复，因此未恢复成功前，作业无法处理数据。因扩缩容过程中需要触发savepoint，因此必须配置obs桶，并

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
查看弹性资源池的基本信息 - 数据湖探索 DLI

实际CUs的计算公式：实际CUs=min{sum（队列maxCU）,弹性资源池maxCU}。计算结果需满足为16CUs的倍数，如果不能整除16CUs则向上取整。实际CUs的分配示例：如表1所示，弹性资源池实际CUs分配的计算过程如下：计算队列maxCU之和：sum（队列maxCU）=

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
CREATE SCHEMA - 数据湖探索 DLI
CREATE SCHEMA - 数据湖探索 DLI

示例创建一个名为web的schema： CREATE SCHEMA web; 在指定路径创建schema，路径必须是obs的并行桶，路径末尾不能加/，指定路径兼容写法示例： CREATE SCHEMA test_schema_5 LOCATION 'obs://${bucket}/user/hive';

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

之间的比较）。系统采样中行的选择依赖于使用的connector。例如，如果使用Hive数据源，这将取决于数据在OBS上的布局。这种采样方法不能保证独立的抽样概率。 SELECT * FROM users TABLESAMPLE SYSTEM (75); 父主题： DQL 语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Flink作业概述 - 数据湖探索 DLI
Flink作业概述 - 数据湖探索 DLI

DLI允许用户提交编译为Jar包的Flink作业，提供了更高的灵活性和自定义能力，适合需要进行复杂数据处理的场景。当社区版Flink提供的Connector不能满足特定需求时，用户可以通过Jar作业来实现自定义的Connector或数据处理逻辑。适合需要实现UDF（用户定义函数）或特定库集成的场

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
审计与日志 - 数据湖探索 DLI
审计与日志 - 数据湖探索 DLI

Service，CTS），是华为云安全解决方案中专业的日志审计服务，提供对各种云资源操作记录的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 CTS可记录的DLI操作列表详见云审计服务支持的DLI操作列表说明。用户开通云审计服务并创建和配置追踪器后，CTS开始记录操作事件

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
创建表时指定表的生命周期 - 数据湖探索 DLI

生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。生命周期设置后，DLI表和OBS表支持数据备份，OBS表的备份目录需要手工设置。且备份目录应选择在并行文件系统上，备份目录必须和原表目录在同一个桶上，备份目录不能与原表相同目录或者子目录同名。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ DLI和MRS都支持Spark组件，但在服务模式、接口方式、应用场景和性能特性上存在一些差异。 DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
FileSytem结果表 - 数据湖探索 DLI

file-path' = '', 'format.type' = '' ); 注意事项该建表语法的数据输出目录为OBS时，OBS必须为并行文件系统，不能为OBS桶。使用fileSystem时必须开启checkpoint，保证作业的一致性。 format.type为parquet时，支持的数据类型为string

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
CLUSTERING - 数据湖探索 DLI
CLUSTERING - 数据湖探索 DLI

predicate => "dt = '2021-08-28'", order => 'id'); 注意事项 table与path参数必须存在一个，否则无法判断需要执行clustering的表。使用由DLI提供的元数据服务时，本命令仅支持配置table参数，不支持配置path参数。如果需要

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
管理DLI全局变量 - 数据湖探索 DLI

用户均可删除该全局变量。变量删除后，SQL中将无法使用该变量。全局变量权限管理针对不同用户，可以通过权限设置分配不同的全局变量，不同用户之间互不影响。管理员用户和全局变量的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其全局变量权限。给新用户设置全局变量权限时，

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

当清理策略为KEEP_ARCHIVED_FILES_BY_DAYS时，该参数可以设置保留多少天以内的归档文件，默认值30（天）。注意事项归档文件，没有备份，删除之后无法恢复。使用由DLI提供的元数据服务时，本命令不支持使用OBS路径。系统响应可以检查任务状态是否成功，查看任务日志确认有无异常。父主题：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Json函数和运算符 - 数据湖探索 DLI

'[1,23,456]' AS ARRAY(INTEGER)); -- [1, 23, 456] JSON函数 NULL到JSON的转换并不能简单地实现。从独立的NULL进行转换将产生一个SQLNULL，而不是JSON 'null'。不过，在从包含NULL的数组或Map进行转换时，生成的JSON将包含NULL。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符

总条数： 655

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

HAVING - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

CREATE SCHEMA - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

Flink作业概述 - 数据湖探索 DLI

审计与日志 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

CLUSTERING - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线