搜索_华为云

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

导入数据功能描述 LOAD DATA可用于导入CSV、Parquet、ORC、JSON、Avro格式的数据，内部将转换成Parquet数据格式进行存储。语法格式 1 2 LOAD DATA INPATH 'folder_path' INTO TABLE [db_name.]table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

导入数据功能描述 LOAD DATA可用于导入CSV、Parquet、ORC、JSON、Avro格式的数据，内部将转换成Parquet数据格式进行存储。语法格式 1 2 LOAD DATA INPATH 'folder_path' INTO TABLE [db_name.]table_name

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

JDBC结果表功能描述 DLI通过JDBC结果表将Flink作业的输出数据输出到关系型数据库中。前提条件 DLI要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

JDBC结果表功能描述 DLI通过JDBC结果表将Flink作业的输出数据输出到关系型数据库中。前提条件 DLI要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

Avro Format 功能描述 Avro格式允许基于Avro schema 读取和写入Avro 数据。目前，Avro schema 从表schema 推导。更多具体使用可参考开源社区文档：Avro Format。支持的Connector Kafka Upsert Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

Avro Format 功能描述 Avro格式允许基于Avro schema 读取和写入Avro 数据。目前，Avro schema 从表schema 推导。支持的Connector Kafka Upsert Kafka 参数说明表1 参数说明参数是否必选默认值类型说明

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

Avro Format 功能描述 Avro格式允许基于Avro schema 读取和写入Avro 数据。目前，Avro schema 从表schema 推导。支持的Connector Kafka Upsert Kafka 参数说明表1 参数说明参数是否必选默认值类型说明

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

Hive结果表功能描述本节介绍利用Flink写Hive的表。Hive结果表的定义，以及创建结果表时使用的参数和示例代码。详情可参考：Apache Flink Hive Read & Write Flink 支持在 BATCH 和 STREAMING 模式下从Hive写入数据。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

JDBC 功能描述 JDBC连接器是Flink内置的Connector，提供了对MySQL、PostgreSQL等常见数据库的读写支持。表类型支持源表、结果表和维表。表1 支持类别类别详情支持表类型源表、维表、结果表前提条件要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

Hbase源表功能描述创建source流从HBase中获取数据，作为作业的输入数据。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

Hbase源表功能描述创建source流从HBase中获取数据，作为作业的输入数据。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

Hbase源表功能描述创建source流从HBase中获取数据，作为作业的输入数据。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

Maxwell Format 功能描述 Maxwell是一个CDC（Changelog Data Capture）工具，可以将MySql中的更改实时流式写入到Kafka等流式connector。Maxwell为changelog提供了统一的格式，而且支持使用JSON对消息进行序列化。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

MySQL CDC源表功能描述 MySQL的CDC源表，即MySQL的流式源表，会先读取数据库的历史全量数据，并平滑切换到Binlog读取上，保证数据的完整读取。前提条件 MySQL CDC要求MySQL版本为5.7或8.0.x。该场景作业需要DLI与MySQL建立增强型跨

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

JDBC源表功能描述 JDBC连接器是Flink内置的Connector，用于从数据库读取相应的数据。前提条件要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

JDBC源表功能描述 JDBC连接器是Flink内置的Connector，用于从数据库读取相应的数据。前提条件要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
FileSystem结果表 - 数据湖探索 DLI

FileSystem结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > FileSystem
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

Hbase结果表功能描述 DLI将作业的输出数据输出到HBase中。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

Hbase结果表功能描述 DLI将作业的输出数据输出到HBase中。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表

总条数： 393

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线