搜索_华为云

Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

Canal Format 功能描述 Canal是一个 CDC（ChangeLog Data Capture，变更日志数据捕获）工具，可以实时地将 MySQL 变更传输到其他系统。Canal 为变更日志提供了统一的数据格式，并支持使用 JSON 或 protobuf序列化消息（Canal

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到RDS 本指导仅适用于Flink 1.12版本。场景描述该场景为根据商品的实时点击量，获取每小时内点击量最高的3个商品及其相关信息。商品的实时点击量数据为输入源发送到Kafka中，再将Kafka数据的分析结果输出到RDS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南概述 DLI提供了使用自定义Jar运行Flink作业并将数据写入到OBS的能力。本章节JAVA样例代码演示将kafka数据处理后写入到OBS，具体参数配置请根据实际环境修改。环境准备已安装和配置IntelliJ IDEA等开发工具以及安装

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
对象存储OBS结果表 - 数据湖探索 DLI

对象存储OBS结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

使用Spark作业访问DLI元数据操作场景 DLI支持用户编写代码创建Spark作业来创建数据库、创建DLI表或OBS表和插入表数据等操作。本示例完整的演示通过编写java代码、使用Spark作业创建数据库、创建表和插入表数据的详细操作，帮助您在DLI上进行作业开发。该功能公测阶段

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

MySQL CDC源表功能描述 MySQL的CDC源表，即MySQL的流式源表，会先读取数据库的历史全量数据，并平滑切换到Binlog读取上，保证数据的完整读取。前提条件 MySQL CDC要求MySQL版本为5.7或8.0.x。该场景作业需要DLI与MySQL建立增强型跨源连接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代码的编写与作业的开发

 帮助中心 > 数据湖探索 DLI > 用户指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码操作场景本例提供使用Spark作业访问DWS数据源的scala样例代码。在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
DWS结果表（不推荐使用） - 数据湖探索 DLI

DWS结果表（不推荐使用）功能描述 DLI将Flink作业的输出数据输出到数据仓库服务（DWS）中。DWS数据库内核兼容PostgreSQL，PostgreSQL数据库可存储更加复杂类型的数据，支持空间信息服务、多版本并发控制（MVCC）、高并发，适用场景包括位置应用、金融保险、

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

DWS结果表功能描述 DLI将Flink作业的输出数据输出到数据仓库服务（DWS）中。DWS数据库内核兼容PostgreSQL，PostgreSQL数据库可存储更加复杂类型的数据，支持空间信息服务、多版本并发控制（MVCC）、高并发，适用场景包括位置应用、金融保险、互联网电商等。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

Redis源表功能描述创建source流从Redis获取数据，作为作业的输入数据。前提条件创建该作业前，需要建立DLI和Redis的增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。构造依赖信息，创建SparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 DLI整理了Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异，便于您了解Spark版本升级后SQL队列上运行的作业在适配新版本引擎时的影响。 histogram_numeric函数的返回值的类型不同

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

Kafka源表功能描述创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件确保已创建Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表

总条数： 418

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Canal Format - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线