搜索_华为云

Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

Hudi查询类型快照查询快照查询（Snapshot Queries）可以读到最新的commit/compaction产生的快照。对于MOR表，还会在查询中合并最新的delta log文件的内容，使读取的数据近实时。增量查询增量查询（Incremental Queries）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
创建集群（废弃） - 数据湖探索 DLI

创建集群（废弃）功能介绍该API用于创建集群，该集群将会绑定用户指定的计算资源。当前接口已废弃，不推荐使用。 URI URI格式： POST /v2.0/{project_id}/clusters 参数说明表1 URI参数名称是否必选说明 project_id 是

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 集群相关API（废弃）
查询Flink作业日志 - 数据湖探索 DLI

查询Flink作业日志操作场景 DLI作业桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台配置DLI作业桶，并查看Flink作业日志的操作方法。使用须知请勿将该DLI作业桶绑定的OBS桶用作其它用途，避免出现作业结果混乱等问题。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
修改弹性资源池的主机信息 - 数据湖探索 DLI

修改弹性资源池的主机信息操作场景主机信息用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。在跨源连接创建完成后，支持修改主机信息。常见的访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。约束限制已获取MR

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
ARCHIVELOG - 数据湖探索 DLI
ARCHIVELOG - 数据湖探索 DLI

ARCHIVELOG 命令功能用于根据配置对Timeline上的Instant进行归档，并从Timeline上将已归档的Instant删除，以减少Timeline的操作压力。命令格式 RUN ARCHIVELOG ON tableIdentifier; RUN ARCHIVELOG

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

COMPACTION 命令功能压缩( compaction)用于在 MergeOnRead表将基于行的log日志文件转化为parquet列式数据文件，用于加快记录的查找。命令格式 SCHEDULE COMPACTION on tableIdentifier |tablelocation;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
DLI JDBC Driver支持的API列表 - 数据湖探索 DLI

DLI JDBC Driver支持的API列表 DLI JDBC Driver支持JDBC标准的众多API，也有部分API不支持用户调用，例如涉及事务调用的API“prepareCall”，调用这类API将抛出“SQLFeatureNotSupportedException”异常

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

插入数据功能描述将SELECT查询结果或某条数据插入到表中。约束限制 insert overwrite语法不适用于“自读自写”场景，该场景因涉及数据的连续处理和更新，如果使用insert overwrite语法可能存在数据丢失风险。 "自读自写"是指在处理数据时能够读取数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
DROP CONSTRAINT - 数据湖探索 DLI
DROP CONSTRAINT - 数据湖探索 DLI

DROP CONSTRAINT 命令功能 DROP CONSTRAINT 命令删除 CHECK 约束。命令格式 ALTER TABLE [database_name.]table_name|DELTA.`obs://bucket_name/tbl_path` DROP CONSTRAINT

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

INSERT INTO 命令功能 INSERT命令用于将SELECT查询结果加载到Hudi表中。命令格式 INSERT INTO tableIndentifier select query; 参数描述表1 INSERT INTO参数参数描述 tableIndentifier

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业本节操作介绍在DLI使用Hudi提交Flink SQL作业的操作步骤。具体语法说明请参考Flink OpenSource SQL1.15语法概览。进入DLI控制台，随后单击左侧菜单的“作业管理 > Flink作业”，进入Flink作业的界面。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

导入数据功能描述 LOAD DATA可用于导入CSV、Parquet、ORC、JSON、Avro格式的数据，内部将转换成Parquet数据格式进行存储。语法格式 1 2 LOAD DATA INPATH 'folder_path' INTO TABLE [db_name.]table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

Maxwell Format 功能描述 Maxwell是一个CDC（Changelog Data Capture）工具，可以将MySql中的更改实时流式写入到Kafka等流式connector。Maxwell为changelog提供了统一的格式，而且支持使用JSON对消息进行序列化。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
数据湖探索 DLI - 数据湖探索 DLI

None 服务介绍数据湖探索 DLI 介绍什么是数据湖探索 02:47 数据湖探索DLI产品介绍功能介绍数据湖探索 DLI 熟悉数据湖探索控制台 03:10 数据湖探索控制台介绍操作指导数据湖探索 DLI 介绍怎样创建提交SQL作业 07:36 数据湖探索SQL作业入门指导

 帮助中心 > 数据湖探索 DLI > 视频帮助
SDK获取与安装 - 数据湖探索 DLI

SDK获取与安装 Python SDK安装方式本节操作介绍安装Python SDK的操作指导。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选择所需的SDK链接，即可获取对应的SDK安装包。 “dli-sdk-python-x.x.x.zip”压缩包，解压后目录结构如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Hudi表使用约束 - 数据湖探索 DLI

Hudi表使用约束 Hudi表类型 Copy On Write 写时复制表也简称COW表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

CLEAN 命令功能用于根据配置对Timeline上的Instant进行clean，删除老旧的历史版本文件，以减少hudi表的数据存储及读写压力。命令格式 RUN CLEAN ON tableIdentifier; RUN CLEAN ON tablelocation; 参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

OPTIMIZE 命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.f

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
INSERT - 数据湖探索 DLI
INSERT - 数据湖探索 DLI

INSERT 命令功能 INSERT命令用于将SELECT查询结果加载到Delta表中。命令格式追加模式： INSERT INTO [database_name.]table_name|DELTA.`obs://bucket_name/tbl_path` select query;

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
RESTORE - 数据湖探索 DLI
RESTORE - 数据湖探索 DLI

RESTORE 命令功能 RESTORE命令用于将Delta表还原到早期状态，支持还原到较早的版本号或者时间戳。命令格式还原Delta表到历史某一时刻的状态： RESTORE [TABLE] [database_name.]table_name|DELTA.`obs_path`

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明

总条数： 770

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi查询类型 - 数据湖探索 DLI

创建集群（废弃） - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

ARCHIVELOG - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

DLI JDBC Driver支持的API列表 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

DROP CONSTRAINT - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

数据湖探索 DLI - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

INSERT - 数据湖探索 DLI

RESTORE - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线