搜索_华为云

Hudi Compaction操作说明 - 数据湖探索 DLI

会将TimeLine里的所有Compaction Plan一个一个去执行，一直到全部都执行完。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-O

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

值。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试地

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

的所有行。在没有ORDER BY的情况下，所有行都被视为对等行，因此未绑定的前导和当前行之间的范围等于未绑定的前导和未绑定的后续之间的范围。例如：下面的查询将salary表中的信息按照每个部门员工工资的大小进行排序。 --创建数据表并插入数据 create table salary

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

Kafka源表功能描述创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DIS结果表 - 数据湖探索 DLI
DIS结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据写入数据接入服务（DIS）中。适用于将数据过滤后导入DIS通道，进行后续处理的场景。数据接入服务（Data Ingestion Service，简称DIS）为处理或分析流数据的自定义应用程序构建数据流管道，主要解决云服务外的数据实时传输到云服务内的问题。数据

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

e支持消息数据、报表数据、推荐类数据、风控类数据、日志数据、订单数据等结构化、半结构化的KeyValue数据存储。利用DLI，用户可方便地将海量数据高速、低时延写入HBase。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie // 元数据文件夹 │

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
WHERE - 数据湖探索 DLI
WHERE - 数据湖探索 DLI

IN时，子查询的返回结果必须是单列。当operator为EXISTS或者NOT EXISTS时，子查询中一定要包含WHERE条件过滤。当子查询中有字段与外部查询相同时，需要在该字段前加上表名。注意事项所要查询的表必须是已经存在的表，否则会出错。示例先通过子查询在cour

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
DIS源表 - 数据湖探索 DLI
DIS源表 - 数据湖探索 DLI

DIS源表功能描述创建source流从数据接入服务（DIS）获取数据。用户数据从DIS接入，Flink作业从DIS的通道读取数据，作为作业的输入数据。Flink作业可通过DIS的source源将数据从生产者快速移出，进行持续处理，适用于将云服务外数据导入云服务后进行过滤、实时分析、监控报告和转储等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

Apache Hive 已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样它也是一个数据管理平台，可用于发现，定义，和演化数据。 Flink与Hive的集成包含两个层面，一是利用了Hive的MetaStore作为持久化的Catalog，二是利用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
日期函数概览 - 数据湖探索 DLI

mat中出现多余的格式串，则只取第一个格式串对应的日期数值，其余的会被视为分隔符。例如isdate("1234-yyyy", "yyyy-yyyy")，会返回True。 last_day last_day(string date) DATE 返回date所在月份的最后一天，格式为

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
Flink OpenSource SQL1.12语法概览 - 数据湖探索 DLI

本章节介绍目前DLI所提供的Flink OpenSource SQL1.12语法列表。参数说明，示例等详细信息请参考具体的语法说明。创建表相关语法表1 创建表相关语法语法分类功能描述创建源表 DataGen源表 DWS源表 Hbase源表 JDBC源表 Kafka源表 MySQL CDC源表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

connector用于将用户输出的数据打印到taskmanager中的error文件或者out文件中，方便用户查看，主要用于代码调试，查看输出结果。前提条件无。注意事项 Print结果表支持以下四种格式内容输出：打印内容条件1 条件2 标识符:任务 ID> 输出数据需要提供前缀打印

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
创建结果表 - 数据湖探索 DLI
创建结果表 - 数据湖探索 DLI

JDBC结果表 Kafka结果表 Print结果表 Redis结果表 Upsert Kafka结果表 FileSystem结果表父主题：数据定义语句DDL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL
HetuEngine SQL语法 - 数据湖探索 DLI

HetuEngine SQL语法使用前必读数据类型 DDL 语法 DML 语法 DQL 语法辅助命令语法预留关键字 SQL函数和操作符

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考
FileSytem结果表 - 数据湖探索 DLI

功能描述 FileSystem结果表用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。数据生成后，可直接对生成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

返回文件/目录在集群中占用的实际空间，即它考虑了为集群设置的复制因子 quota 名称配额（名称配额是对当前目录树中的文件和目录名称数量的硬性限制） space_quota 空间配额（空间配额是对当前目录树中的文件所使用的字节数量的硬性限制）注意事项使用由DLI提供的元数据服务时，不支持本命令。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
HAVING - 数据湖探索 DLI
HAVING - 数据湖探索 DLI

IN操作符。注意事项所要查询的表必须是已经存在的表，否则会出错。此处的sub_query与聚合函数的位置不能左右互换。示例对表student_info按字段name进行分组，计算每组中记录数，若其记录数等于子查询中表course_info的记录数，返回表student_

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 1508

上一页
1
...
24
25
26
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Compaction操作说明 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

DIS结果表 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

WHERE - 数据湖探索 DLI

DIS源表 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

日期函数概览 - 数据湖探索 DLI

Flink OpenSource SQL1.12语法概览 - 数据湖探索 DLI

Print - 数据湖探索 DLI

创建结果表 - 数据湖探索 DLI

HetuEngine SQL语法 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

HAVING - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线