搜索_华为云

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

接。 DLI Livy工具下载及安装本次操作下载的DLI Livy版本为apache-livy-0.7.2.0107-bin.tar.gz，后续版本变化请根据实际情况修改。单击下载链接，获取DLI Livy工具压缩包。使用WinSCP工具，将获取的工具压缩包上传到准备好的ECS服务器目录下。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI Python SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下。完整样例代码和依赖包说明请参考：Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

DLI SDK简介 DLI SDK简介数据湖探索服务软件开发工具包（DLI SDK，Data Lake Insight Software Development Kit）是对DLI服务提供的REST API进行的作业提交的封装，以简化用户的开发工作。用户直接调用DLI SDK提供的接口函数即可实现使用提交DLI

帮助中心 > 数据湖探索 DLI > SDK参考
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

A样例代码演示将kafka数据处理后写入到OBS，具体参数配置请根据实际环境修改。环境准备已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码（Flink 1.12）中“pom文件配置”说明。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink Jar作业开发指南
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下：前提条件已参考Java SDK概述配置Java SDK环境。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Spark读取OBS文件数据，详见使用Spark Jar作业读取和查询OBS数据。配置S

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Spark SQL常用配置项说明 - 数据湖探索 DLI

dynamicPartitionPruning.enabled true 该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

initial String 消费数据时的启动模式。 initial（默认）：在第一次启动时，会先扫描历史全量数据，然后读取最新的Binlog数据。 latest-offset：在第一次启动时，不会扫描历史全量数据，直接从Binlog的末尾（最新的Binlog处）开始读取，即只读取该Connector启动以后的最新变更。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

initial String 消费数据时的启动模式。 initial（默认）：在第一次启动时，会先扫描历史全量数据，然后读取最新的Binlog数据。 latest-offset：在第一次启动时，不会扫描历史全量数据，直接从Binlog的末尾（最新的Binlog处）开始读取，即只读取该Connector启动以后的最新变更。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

</dependency> 注意事项暂不支持通过python写UDF、UDTF、UDAF自定义函数。如果使用IntelliJ IDEA工具对创建的自定义函数进行调试，则需要在IDEA上勾选：include dependencies with "Provided" scope，

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 函数
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

</dependency> 注意事项暂不支持通过python写UDF、UDTF、UDAF自定义函数。如果使用IntelliJ IDEA工具对创建的自定义函数进行调试，则需要在IDEA上勾选：include dependencies with "Provided" scope，

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL）
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

</dependency> 注意事项暂不支持通过python写UDF、UDTF、UDAF自定义函数。如果使用IntelliJ IDEA工具对创建的自定义函数进行调试，则需要在IDEA上勾选：include dependencies with "Provided" scope，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL）
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

</dependency> 注意事项暂不支持通过python写UDF、UDTF、UDAF自定义函数。如果使用IntelliJ IDEA工具对创建的自定义函数进行调试，则需要在IDEA上勾选：include dependencies with "Provided" scope，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
迁移数据场景概述 - 数据湖探索 DLI

迁移数据场景概述为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，你可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
数据湖探索简介 - 数据湖探索 DLI

多个队列同时扩容时不能设置优先级，在资源不够时，会导致部分队列扩容申请失败。您可以根据当前业务波峰和波谷时间段，设置各队列在弹性资源池中的优先级，保证资源的合理调配。 BI工具对接永洪BI：与永洪BI对接实现数据分析。具体内容请参考《数据湖探索开发指南》。 DLI核心引擎：Spark+Flink+Trino S

帮助中心 > 数据湖探索 DLI > 产品介绍
使用CDM迁移数据至DLI - 数据湖探索 DLI

使用CDM迁移数据至DLI CDM提供了可视化的迁移任务配置页面，支持多种数据源到数据湖的迁移能力。本节操作介绍使用CDM迁移工具将数据从数据源迁移至DLI的操作步骤。图1 使用CDM迁移数据至DLI操作流程步骤1：创建CDM集群 CDM集群用于执行数据迁移作业，将数据从数据源迁移至DLI。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
数据迁移与传输方式概述 - 数据湖探索 DLI

导入数据的具体操作请参考上传对象。迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，你可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
使用DLI进行电商BI报表分析 - 数据湖探索 DLI

Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS Browser+支持AK方式登录，以及授权码登录两种登录方式。登录步骤请参考《对象存储服务工具指南》。通过OBS Browser+上传数据。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
SQL作业使用咨询 - 数据湖探索 DLI

timeout（单位是秒）参数配置超时时间。 DLI支撑本地测试Spark作业吗? DLI暂不支持本地测试Spark作业，您可以安装DLI Livy工具，通过Livy工具提供的交互式会话能力调测Spark作业。推荐使用使用Livy提交Spark Jar作业。 DLI 表(OBS表 / DLI 表 )数据支持删除某行数据吗？

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
查询所有队列 - 数据湖探索 DLI

与该队列绑定的计算单元数，即当前队列的CU数。 charging_mode 否 Integer 队列的收费模式。 0：系统默认default队列。按照扫描量计费。 1：表示按照CU时收费。 2：表示按照包年包月收费。 resource_id 否 String 队列的资源ID。 enterprise_project_id

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）

总条数： 104

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

使用DLI进行电商BI报表分析 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线