搜索_华为云

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

表1 Spark Jar作业开发环境准备项说明操作系统 Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

rypt。委托权限示例请参考自定义DLI委托权限和常见场景的委托权限策略。仅支持Flink1.15版本使用DEW管理访问凭据，在创建作业时，请配置作业使用Flink1.15版本、且已在作业中配置允许DLI访问DEW的委托信息。自定义委托及配置请参考自定义DLI委托权限。使用

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
使用CDM迁移数据至DLI - 数据湖探索 DLI

驱动版本 CDM连接关系数据库前，需要先上传所需关系数据库的JDK8版本.jar格式驱动。MySQL的驱动请从https://downloads.mysql.com/archives/c-j/选择5.1.48版本下载，从中获取mysql-connector-java-5.1.48

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch 本指导仅适用于Flink 1.12版本。场景描述本示例场景对用户购买商品的数据信息进行分析，将满足特定条件的数据结果进行汇总输出。购买商品数据信息为数据源发送到Kafka中，再将Kafka数据的分析结果输出到Elasticsearch中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到RDS 本指导仅适用于Flink 1.12版本。场景描述该场景为根据商品的实时点击量，获取每小时内点击量最高的3个商品及其相关信息。商品的实时点击量数据为输入源发送到Kafka中，再将Kafka数据的分析结果输出到RDS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

表1 Spark Jar作业开发环境准备项说明操作系统 Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

仅支持Spark3.3.1（Spark通用队列场景）及以上版本使用DEW管理访问凭据，在创建作业时，请配置作业使用Spark3.3.1版本、且已在作业中配置允许DLI访问DEW的委托信息。自定义委托及配置请参考自定义DLI委托权限。使用该功能，所有涉及OBS的桶，都需要进行配置AKSK。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

connector类型，对于kafka，需配置为'kafka'。 connector.version 否 Kafka版本，支持：'0.10'、 '0.11'。0.10或0.11版本号对应kafka版本号2.11-2.4.0及其他历史版本。 format.type 是数据序列化格式，支持：'csv'、 'json'及'avro'等。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业提交Spark jar作业的场景需要手动配置由LakeFormation提供元数据服务的Hudi锁实现类，请参照 Hudi锁配置说明。登录DLI管理控制台，选择“作业管理 > Spark作业”，进入到Spark作业的界面。提交Hudi相关的Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

-->测试）。若能连通，则表示跨源已经绑定成功；否则表示未成功。创建flink opensource sql作业，选择flink1.12版本，并提交运行，其代码如下： create table kafkaSource( id bigint, name string,

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

connector类型，对于kafka，需配置为'kafka'。 connector.version 是 Kafka版本，支持：'0.10'、 '0.11'。0.10或0.11版本号对应kafka版本号2.11-2.4.0及其他历史版本。 format.type 是数据反序列化格式，支持：'csv', 'json'及'avro'等。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
修改队列定时扩缩容计划（废弃） - 数据湖探索 DLI

修改队列定时扩缩容计划（废弃）功能介绍该API用于修改指定ID的队列的定时扩缩容计划。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： PUT /v1/{project_id}/queues/{queue_name}/plans/{plan_id}

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

Flink版本是选择作业运行时所使用的Flink的版本。本例选择使用Flink1.15版本时请在作业中配置允许DLI访问的云服务的委托信息。委托否选择Flink1.15版本时需要用户自行配置委托，否则可能影响作业运行。 Flink Jar作业的高级配置。参考表6配置Flink

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

每个区域默认对应一个项目，由系统预置。系统默认项目名称弹性资源池名称。 dli_resource_pool 规格选择弹性资源池规格。标准版 CU范围弹性资源池最大最小CU范围。 64-64 网段规划弹性资源池所属的网段。如需使用DLI增强型跨源，弹性资源池网段与数据源网段不

 帮助中心 > 数据湖探索 DLI > 快速入门
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

> 测试）。如果能连通，则表示跨源已经绑定成功；否则表示未成功。创建flink opensource sql作业，选择flink1.15版本，并提交运行，其代码如下： CREATE TABLE kafkaSource ( id bigint, name string,

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在进行UDTF开发前，请准备以下开发环境。表1 UDTF开发环境准备项说明操作系统 Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
创建增强型跨源连接 - 数据湖探索 DLI

创建增强型跨源连接功能介绍该API用于创建与其他服务的增强型跨源连接。如果需要了解Console界面的使用方法，可参考《数据湖探索用户指南》中的“增强型跨源连接”。系统default队列不支持创建跨源连接。调试您可以在API Explorer中调试该接口。 URI URI格式

 帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

Hive源表简介 Apache Hive 已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样它也是一个数据管理平台，可用于发现，定义，和演化数据。 Flink与Hive的集成包含两个层面，一是利用了Hive的MetaStore作为持

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 75

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

修改队列定时扩缩容计划（废弃） - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线