搜索_华为云

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

步骤4：创建增强型跨源连接创建DLI连接Kafka的增强型跨源连接在Kafka管理控制台，选择“Kafka专享版”，单击对应的Kafka名称，进入到Kafka的基本信息页面。在“连接信息”中获取该Kafka的“内网连接地址”，在“基本信息”的“网络”中获取获取该实例的“虚拟私有云”和“子网”信息，方便后续操作步骤使用。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink OpenSource SQL作业开发指南
增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

对等连接用于实现跨VPC通信，请确保数据源使用的安全组开放了DLI队列网段的访问，并且在使用跨源过程中不要删除该对等连接。对等连接的连接状态：跨源连接的状态信息，包括以下三种状态：创建中、已激活、已失败。当连接状态显示为“已失败”时，单击左边对应的，可查看详细的错误信息。图1

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

使用方式编写自定义函数代码。具体的代码样例可以参考UDF、UDTF或者UDAF。将写好的自定义函数编译并打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，在需要编辑的Flink SQL作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL）
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

使用方式编写自定义函数代码。具体的代码样例可以参考UDF、UDTF或者UDAF。将写好的自定义函数编译并打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，在需要编辑的Flink SQL作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL）
开源Kafka输入流 - 数据湖探索 DLI

创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka服务端的端口如果监听在hostname上，则需要将Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
开源Kafka输入流 - 数据湖探索 DLI

创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka服务端的端口如果监听在hostname上，则需要将Kafka

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
流表JOIN - 数据湖探索 DLI
流表JOIN - 数据湖探索 DLI

流与表进行连接操作，从表中查询并补全流字段。目前支持连接RDS表和DCS服务的Redis表。通过ON条件描述查询的Key，并补全表结构的Value字段。 RDS表的数据定义语句请参见创建RDS表。 Redis表的数据定义语句请参见创建Redis表。语法格式 1 2 FROM tableExpression

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL）
流生态作业开发指引 - 数据湖探索 DLI

通过对等连接建立与其他VPC的网络连接后，用户可以在DLI的租户独享集群中访问所有Flink和Spark支持的数据源与输出源，如Kafka、Hbase、ElasticSearch等。自拓展生态用户可通过编写代码实现从想要的云生态或者开源生态获取数据，作为Flink作业的输入数据。云服务生态开发

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink Jar作业开发指南
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

数据库即按照数据结构来组织、存储和管理数据的仓库。DLI服务管理权限的基础单元是数据库，赋权以数据库为单位。在DLI中，表和数据库是定义底层数据的元数据容器。表中的元数据让DLI知道数据所在的位置，并指定了数据的结构，例如列名称、数据类型和表名称。数据库是表的逻辑分组。元数据元数据（M

帮助中心 > 数据湖探索 DLI > 产品介绍
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

数据源之间的网络连通方法，如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和外部数据源之间的网络。配置DLI 队列与公网网络连通介绍DLI队列在公网访问场景下网络连通的方法。通过配置SNAT规则，添加到公网的路由信息，可以实现队列到和公网的网络打通。

帮助中心 > 数据湖探索 DLI > 快速入门
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

本样例只适用于MRS的OpenTSDB。前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
流表JOIN - 数据湖探索 DLI
流表JOIN - 数据湖探索 DLI

流与表进行连接操作，从表中查询并补全流字段。目前支持连接RDS表和DCS服务的Redis表。通过ON条件描述查询的Key，并补全表结构的Value字段。 RDS表的数据定义语句请参见创建RDS表。 Redis表的数据定义语句请参见创建Redis表。语法格式 1 2 FROM tableExpression

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 数据操作语句DML
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

上传Jar包到OBS OBS控制台将生成的UDTF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDTF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDTF函数。 6 验证和使用DLI的UDTF函数 DLI控制台在DLI作业中使用创建的UDTF函数。操作步骤新

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
批作业SQL常用配置项说明 - 数据湖探索 DLI

剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
创建并提交SQL作业 - 数据湖探索 DLI

柱状图和折线图的X轴可为任意一列，Y轴仅支持数值类型的列，扇形图对应图例和指标。 SQL编辑器功能概览 SQL作业参数设置单击SQL编辑器页面右上方的“设置”按钮。可以设置SQL作业运行参数和作业标签。参数设置：以“key/value”的形式设置提交SQL作业的配置项。详细

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

在30秒内的订单数量，并根据窗口的订单id和窗口开启时间作为主键，将结果实时统计到JDBC中：根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

在30秒内的订单数量，并根据窗口的订单id和窗口开启时间作为主键，将结果实时统计到JDBC中：根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Spark SQL常用配置项说明 - 数据湖探索 DLI

并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖。涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis

总条数： 278

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

开源Kafka输入流 - 数据湖探索 DLI

开源Kafka输入流 - 数据湖探索 DLI

流表JOIN - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

流表JOIN - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

批作业SQL常用配置项说明 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线