搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark.sql.types

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
数据湖探索 DLI - 数据湖探索 DLI

None 服务介绍数据湖探索 DLI 介绍什么是数据湖探索 02:47 数据湖探索DLI产品介绍功能介绍数据湖探索 DLI 熟悉数据湖探索控制台 03:10 数据湖探索控制台介绍操作指导数据湖探索 DLI 介绍怎样创建提交SQL作业 07:36 数据湖探索SQL作业入门指导

 帮助中心 > 数据湖探索 DLI > 视频帮助
查询Flink作业日志 - 数据湖探索 DLI

查询Flink作业日志操作场景 DLI作业桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台配置DLI作业桶，并查看Flink作业日志的操作方法。使用须知请勿将该DLI作业桶绑定的OBS桶用作其它用途，避免出现作业结果混乱等问题

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Hudi表使用约束 - 数据湖探索 DLI

Hudi表使用约束 Hudi表类型 Copy On Write 写时复制表也简称COW表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka 概述本节操作介绍使用Flink Jar连接开启SASL_SSL认证的Kafka的操作方法。如需使用Flink OpenSource SQL连接开启SASL_SSL认证的Kafka，请参考Flink SQL语法参考-

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
ARCHIVELOG - 数据湖探索 DLI
ARCHIVELOG - 数据湖探索 DLI

ARCHIVELOG 命令功能用于根据配置对Timeline上的Instant进行归档，并从Timeline上将已归档的Instant删除，以减少Timeline的操作压力。命令格式 RUN ARCHIVELOG ON tableIdentifier; RUN ARCHIVELOG

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

COMPACTION 命令功能压缩( compaction)用于在 MergeOnRead表将基于行的log日志文件转化为parquet列式数据文件，用于加快记录的查找。命令格式 SCHEDULE COMPACTION on tableIdentifier |tablelocation

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
DROP CONSTRAINT - 数据湖探索 DLI
DROP CONSTRAINT - 数据湖探索 DLI

DROP CONSTRAINT 命令功能 DROP CONSTRAINT 命令删除 CHECK 约束。命令格式 ALTER TABLE [database_name.]table_name|DELTA.`obs://bucket_name/tbl_path` DROP CONSTRAINT

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

导入数据功能描述 LOAD DATA可用于导入CSV、Parquet、ORC、JSON、Avro格式的数据，内部将转换成Parquet数据格式进行存储。语法格式 1 2 LOAD DATA INPATH 'folder_path' INTO TABLE [db_name.]table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

Maxwell Format 功能描述 Maxwell是一个CDC（Changelog Data Capture）工具，可以将MySql中的更改实时流式写入到Kafka等流式connector。Maxwell为changelog提供了统一的格式，而且支持使用JSON对消息进行序列化

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
DLI JDBC Driver支持的API列表 - 数据湖探索 DLI

DLI JDBC Driver支持的API列表 DLI JDBC Driver支持JDBC标准的众多API，也有部分API不支持用户调用，例如涉及事务调用的API“prepareCall”，调用这类API将抛出“SQLFeatureNotSupportedException”异常。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
SDK获取与安装 - 数据湖探索 DLI

SDK获取与安装 Python SDK安装方式本节操作介绍安装Python SDK的操作指导。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选择所需的SDK链接，即可获取对应的SDK安装包。 “dli-sdk-python-x.x.x.zip”压缩包，解压后目录结构如下

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

INSERT INTO 命令功能 INSERT命令用于将SELECT查询结果加载到Hudi表中。命令格式 INSERT INTO tableIndentifier select query; 参数描述表1 INSERT INTO参数参数描述 tableIndentifier

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
增强型跨源连接概述 - 数据湖探索 DLI

增强型跨源连接概述为什么要创建增强型跨源连接？ DLI跨源分析场景连接外部数据源时，由于数据源的VPC与DLI VPC不同，网络无法连通，导致DLI无法读取数据源数据。DLI提供的增强型跨源连接功能可以实现DLI与数据源的网络连通。本节操作为您介绍跨VPC的数据源网络连通方案：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
ALTER COLUMN - 数据湖探索 DLI
ALTER COLUMN - 数据湖探索 DLI

ALTER COLUMN 命令功能 ALTER TABLE ... ALTER COLUMN语法用于修改当前列属性包括列comment、空约束，当前不支持修改列类型、列位置。注意事项目前不支持修改列类型。目前不支持修改已存在列的顺序。目前不支持指定顺序添加列。命令语法 ALTER

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Schema演进语法说明
INSERT - 数据湖探索 DLI
INSERT - 数据湖探索 DLI

INSERT 命令功能 INSERT命令用于将SELECT查询结果加载到Delta表中。命令格式追加模式： INSERT INTO [database_name.]table_name|DELTA.`obs://bucket_name/tbl_path` select query

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

OPTIMIZE 命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

CLEAN 命令功能用于根据配置对Timeline上的Instant进行clean，删除老旧的历史版本文件，以减少hudi表的数据存储及读写压力。命令格式 RUN CLEAN ON tableIdentifier; RUN CLEAN ON tablelocation; 参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

使用前必读使用须知 DLI HetuEngine功能为白名单功能，如需使用，请在管理控制台右上角，选择“工单 > 新建工单”，提交申请。使用前您需要先创建一个HetuEngine类型的SQL队列，具体操作请参考创建弹性资源池并添加队列。 HetuEngine SQL需搭配lakeformation

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
RESTORE - 数据湖探索 DLI
RESTORE - 数据湖探索 DLI

RESTORE 命令功能 RESTORE命令用于将Delta表还原到早期状态，支持还原到较早的版本号或者时间戳。命令格式还原Delta表到历史某一时刻的状态： RESTORE [TABLE] [database_name.]table_name|DELTA.`obs_path`

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明

总条数： 857

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

数据湖探索 DLI - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

ARCHIVELOG - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

DROP CONSTRAINT - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

DLI JDBC Driver支持的API列表 - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

ALTER COLUMN - 数据湖探索 DLI

INSERT - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

RESTORE - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线