搜索_华为云

概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

及线下数据库的异构数据进行探索。您可以使用本文档提供API对数据湖探索进行相关操作，包括队列、SQL作业、Flink作业、Spark作业和跨源连接等等。支持的全部操作请参见API概览。在调用数据湖探索API之前，请确保已经充分了解数据湖探索相关概念。详细信息请参见产品介绍。父主题：

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

Jersey | 7081 | NULL | 225 (10 rows) CUBE 为给定的列生成所有可能的分组，比如 (origin_state, destination_state) 的可能分组为：(origin_state, de

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
HetuEngine SQL语法 - 数据湖探索 DLI

HetuEngine SQL语法使用前必读数据类型 DDL 语法 DML 语法 DQL 语法辅助命令语法预留关键字 SQL函数和操作符

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

在执行Group By聚合操作时，如果某些分组键对应的数据量特别大，而其他分组键对应的数据量很小，在聚合过程中，数据量大的分组会占用更多的计算资源和时间，导致处理速度变慢，出现数据倾斜。 JOIN 操作倾斜在执行表JOIN操作时，参与JOIN的键在某个表中分布极不均匀，导致大量数据集中

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据应用场景在车联网领域，云计算与大数据为企业提供了强大的分析挖掘能力，可以帮助企业和车队管理者更加科学、便捷地进行车辆数据管理与分析。方案架构根据已有的某货运公司车辆定时上报的详单数据和货运订单数据，DLI可以完成对该货运公司车辆行驶特点分析、记录明细的查询。详细的数据说明请参考数据说明。

帮助中心 > 数据湖探索 DLI > 最佳实践
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

12 13 14 15 16 17 //实例化ExportJob对象，传入导出数据所需的队列、数据库名、表名（通过实例化Table对象获取）和导出数据的存储路径，仅支持Table类型为MANAGED private static void exportData(Queue queue

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
对跨源DWS表执行insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated - 数据湖探索 DLI

pkg_saa_out_bound_monitor_p_saa_outbound_order_cust_sum 这个函数里面有delete 和 insert SAA_OUTBOUND_ORDER_CUST_SUM的操作。处理步骤修改作业逻辑，避免对同一张表并发执行insert overwrite操作。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

null 问题根因该Flink SQL作业在配置作业运行参数时，有选择保存作业日志或开启Checkpoint，配置了OBS桶保存作业日志和Checkpoint。但是运行该Flink SQL作业的IAM用户没有OBS写入权限导致该问题。解决方案登录IAM控制台页面，单击“用户

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
使用DLI分析账单消费数据 - 数据湖探索 DLI

施。资源和成本规划表1 资源和成本规划资源资源说明成本说明 DLI 数据湖探索（DLI）作为华为云大数据分析平台，其计费项包括存储费用与计算费用两项，计费类型包括包周期（包年包月），套餐包和按需计费三种。 DLI目前支持三种作业：SQL作业，Flink作业和Spark作业。

帮助中心 > 数据湖探索 DLI > 最佳实践
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

close(); 示例认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量System.getenv("AK")和System.getenv("SK")。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

等外部系统。但是，目前 Flink 无法将 UPDATE_BEFORE 和 UPDATE_AFTER 合并为一条 UPDATE 消息。因此，Flink 将 UPDATE_BEFORE 和 UDPATE_AFTER 编码为 DELETE 和 INSERT Maxwell 消息。参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
查询SQL作业日志 - 数据湖探索 DLI

件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置 > 工程配置”。在“工程配置”页面

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

建：“表名_rt”和“表名_ro”两张表。查询后缀为rt的表等同于实时查询，查询后缀为ro的表代表读优化查询。例如：通过Spark SQL创建hudi表名为${table_name}，同步元数据服务后，数据库中多出两张表分别为${table_name}_rt和${table_name}_ro。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

DLI Hudi元数据 DLI Hudi元数据说明创建Hudi表时会在元数据仓创建表的相关元数据信息。 Hudi支持对接DLI元数据和Lakeformation元数据（仅Spark 3.3.1及以上版本支持对接Lakeformation元数据），对接方式与Spark一致。 DL

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
Spark SQL常用配置项说明 - 数据湖探索 DLI

的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区修剪优化，有助于减少内存使用，避免内存溢出和频繁的Full GC。但禁用此优化可能会降低查询性能，禁用后Spark将不会自动修剪掉那些不满足条件的分区。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

作业相关完整样例代码和依赖包说明请参考：Python SDK概述。导入数据 DLI提供导入数据的接口。您可以使用该接口将存储在OBS中的数据导入到已创建的DLI表中。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
窗口关联 - 数据湖探索 DLI
窗口关联 - 数据湖探索 DLI

Top-N 和窗口关联。目前，窗口关联需要在 join on 条件中包含两个输入表的 window_start 等值条件和 window_end 等值条件。窗口关联支持 INNER/LEFT/RIGHT/FULL OUTER/ANTI/SEMI JOIN。更多介绍和使用请参考开源社区文档：窗口关联。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。 value 是 String 标签的值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

30倍或更高。节省存储空间 Parquet还支持灵活的压缩选项，因此可以显著减少磁盘上的存储。存储的节省可高达约75%。资源和成本规划表1 资源和成本规划资源资源说明成本说明 OBS 需要创建一个OBS桶将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。

帮助中心 > 数据湖探索 DLI > 最佳实践
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表什么是DLI datasourcev1表和DLI datasourcev2表？ DLI datasource v1表（以下简称V1表）：DLI的Datasource表格式，建表/插入/truncate命令使用DLI自

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比

总条数： 550

上一页
1
...
18
19
20
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

概述 - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

HetuEngine SQL语法 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

对跨源DWS表执行insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated - 数据湖探索 DLI

Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

窗口关联 - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线