搜索_华为云

DLI作业开发流程 - 数据湖探索 DLI

详细操作请参考创建并提交SQL作业。适用于数据仓库查询、报表生成、OLAP（在线分析处理）等场景。 Flink作业专为实时数据流处理设计，适用于低时延、需要快速响应的场景。适用于实时监控、在线分析等场景。 Flink OpenSource作业：DLI提供了标准的连接器（co

帮助中心 > 数据湖探索 DLI > 用户指南
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

还可以对接云上Mysql、GaussDB、MRS HBase、DMS、DWS、OBS等，开箱即用；在资源方面，产品可以自适应业务的流量，智能对资源进行弹性伸缩，保障业务稳定性，不需要人工进行额外调试。 DLI Flink与MRS Flink的功能对比如表1所示。表1 DLI Flink与MRS

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
创建表时指定表的生命周期 - 数据湖探索 DLI

删除表后，表的所有属性信息全部会删除，包括生命周期。新建同名表后，表的生命周期以新设置的属性为准。约束限制表生命周期处于公测阶段，如果有需要请联系客服申请开通白名单。使用生命周期前需要在“全局配置 > 服务授权 > 委托权限设置”中，对（Tenant Administrator(项目级)）授权。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

本节操作介绍在DataArts Studio开发DLI SQL作业的操作步骤。开发流程图1 在DataArts Studio开发DLI SQL作业的流程图环境准备：准备执行作业所需的DLI资源和DataArts Studio资源。请参考环境准备。创建数据库和表：提交SQL脚本创建数据库和表。请参考步骤1：创建数据库和表。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
禁止或恢复表的生命周期 - 数据湖探索 DLI

的生命周期，则会增加“dli.table.lifecycle.status”这一属性。约束限制表生命周期处于公测阶段，如果有需要请联系客服申请开通白名单。表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

业。 SQL作业适用于使用标准SQL语句进行查询的场景。通常用于结构化数据的查询和分析。 Flink作业 Flink作业专为实时数据流处理设计，适用于低时延、需要快速响应的场景。适用于实时监控、在线分析等场景。 Flink OpenSource作业：提交作业时可以使用DLI提供的

 帮助中心 > 数据湖探索 DLI > 产品介绍
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

使用DLI分析电商实时业务数据应用场景当前线上购物无疑是最火热的购物方式，而电商平台则又可以以多种方式接入，例如通过web方式访问、通过app的方式访问、通过微信小程序的方式访问等等。而电商平台则需要每天统计各平台的实时访问数据量、订单数、访问人数等等指标，从而能在显示大屏上

 帮助中心 > 数据湖探索 DLI > 最佳实践
Flink 1.15版本说明 - 数据湖探索 DLI

2025年6月30日 2026年6月30日更多版本支持信息请参考DLI计算引擎版本生命周期。 Flink 1.15版本说明 Flink 1.15版本在语法设计上实现了更高的兼容性，与主流开源技术标准保持一致。 Flink 1.15版本新增读写Hive、Hudi等Connector。 Flink 1

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

使用DLI提交Spark Jar作业操作场景 DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。

帮助中心 > 数据湖探索 DLI > 快速入门
DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

11版本停止服务后，可以使用哪个版本替换？推荐使用DLI Flink 1.15版本。 Flink 1.15版本有哪些优势？ Flink 1.15版本在语法设计上实现了更高的兼容性，与主流开源技术标准保持一致。 Flink 1.15版本新增读写Hive、Hudi等Connector。更多Flink

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Hudi数据表Compaction规范 - 数据湖探索 DLI

1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计规范以及实际流量的波动结合考虑，建议Compaction作业CPU与内存的比例按照1:4~1:8配置，保证Compaction作业稳定运行

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Hudi Clustering操作说明 - 数据湖探索 DLI

REPLACE操作类型，该操作类型将在Hudi元数据时间轴中标记Clustering操作。 Clustering服务基于Hudi的MVCC设计，允许继续插入新数据，而Clustering操作在后台运行以重新格式化数据布局，从而确保并发读写者之间的快照隔离。总体而言Clustering分为两个部分：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境自定义镜像应用场景通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Superset连接DLI进行数据查询和分析 Superset是一个开源的数据探索和可视化平台，支持对数据进行快速、直观的探索，同时支持创建丰富的数据可视化和交互式仪表板。通过将Superset与DLI对接，用户可以访问DLI进行数据查询和分析,简化了数据访问流程，提供了数

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
怎样配置DLI队列与数据源的网络连通？ - 数据湖探索 DLI

怎样配置DLI队列与数据源的网络连通？配置DLI队列与内网数据源的网络连通 DLI在创建运行作业需要连接外部其他数据源，如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和外部数据源之间的网络。 DLI提供的增强型跨源连接功能，底层采用对等连接的方式打通

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据应用场景在车联网领域，云计算与大数据为企业提供了强大的分析挖掘能力，可以帮助企业和车队管理者更加科学、便捷地进行车辆数据管理与分析。方案架构根据已有的某货运公司车辆定时上报的详单数据和货运订单数据，DLI可以完成对该货运公司车辆行驶特点分析、记录明细的查询。

帮助中心 > 数据湖探索 DLI > 最佳实践
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复什么是从checkpoint恢复？ Flink Checkpoint 是一种容错恢复机制。这种机制保证了实时程序运行时，遇到异常或者机器问题时能够进行自我恢复。从checkpoint恢复的原则通常当作业执行失败

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
创建IAM用户并授权使用DLI - 数据湖探索 DLI

创建IAM用户并授权使用DLI 如果您需要对您所拥有的DLI资源进行精细的权限管理，您可以使用统一身份认证服务（Identity and Access Management，简称IAM），具体IAM使用场景可以参考权限管理概述。如果华为云账号已经能满足您的要求，不需要创建独立的

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
在Spark SQL作业中使用UDF - 数据湖探索 DLI

在Spark SQL作业中使用UDF 操作场景 DLI支持用户使用Hive UDF（User Defined Function，用户定义函数）进行数据查询等操作，UDF只对单行数据产生作用，适用于一进一出的场景。约束限制在DLI Console上执行UDF相关操作时，需要使用自建的SQL队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南

总条数： 74

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI作业开发流程 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Flink 1.15版本说明 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

怎样配置DLI队列与数据源的网络连通？ - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

创建IAM用户并授权使用DLI - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线