搜索_华为云

创建增强型跨源连接 - 数据湖探索 DLI

格式：IP:端口测试连接前，请确保外部数据源的安全组已放通队列的网段。图3 测试队列与数据源的网络连通性相关操作创建跨源成功但测试网络连通性失败怎么办？父主题：配置DLI与数据源网络连通（增强型跨源连接）

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
查看Delta表历史操作记录 - 数据湖探索 DLI

isolationLevel 隔离级别 isBlindAppend 是否追加数据 operationMetrics 操作的度量（例如，修改的文件数、行数、字节数等信息） engineInfo Spark和Delta版本信息父主题： Delta Time Travel

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
FileSystem源表 - 数据湖探索 DLI
FileSystem源表 - 数据湖探索 DLI

connector 是无 String 固定位filesystem。 path 是无 String OBS路径。 format 是无 String 文件格式。支持csv、parquet格式。常见问题无父主题：创建源表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Spark开源命令支持说明 - 数据湖探索 DLI

DATABASE testDB SET DBPROPERTIES ('Edited-by' = 'John'); 不支持不支持修改数据库在OBS上的文件存放路径 ALTER DATABASE testDB SET LOCATION 'obs://bucketName/filePath'; 不支持

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

range 0 = 0 to 479 while trying to read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
数据迁移与传输方式概述 - 数据湖探索 DLI

LI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。具体操作请参考迁移外部数据源数据至DLI。图1 迁移数据至DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

format 是（none） String 指定使用格式，这里应该是'avro'。 avro.codec 否（none） String 仅用于文件系统，avro 压缩编解码器。默认不压缩。目前支持：deflate、snappy、bzip2、xz。数据类型映射目前，Avro schema

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

OVERWRITE、TRUNCATE TABLE）时是否清除相关数据： "auto.purge"='true'时，清除元数据和数据文件。 "auto.purge"='false'时，仅清除元数据，数据文件会移入OBS回收站。默认值为“false”，且不建议用户修改此属性，避免数据删除后无法恢复。 CREATE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
创建并提交SQL作业 - 数据湖探索 DLI

当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Spark SQL常用配置项说明 - 数据湖探索 DLI

批作业SQL语法的常用配置项。表1 常用配置项名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
DESCRIBE - 数据湖探索 DLI
DESCRIBE - 数据湖探索 DLI

createdAt 建表时间戳 lastModified 最后一次修改的时间戳 partitionColumns 分区列 numFiles 表的最新版本中的文件个数 sizeInBytes 表的最新快照的大小（以字节为单位） properties 为此表设置的所有属性 minReaderVersion

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Notebook相关操作请参考JupyterLab简介及常用操作。 Notebook中的数据上传请参考上传文件至JupyterLab。 Notebook中的数据下载请参考下载JupyterLab文件到本地。（可选）配置Notebook访问DLI元数据在完成DLI和Notebook的对接后

 帮助中心 > 数据湖探索 DLI > 用户指南
Upsert Kafka源表 - 数据湖探索 DLI

单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。数据结果参考如下： +I(202103251202020001

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <ar

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
查看SQL执行计划 - 数据湖探索 DLI

系统从DLI作业桶中查询对应作业的SQL执行计划并展示在控制台页面。如果DLI作业桶中的SQL执行计划已经删除，那么点击查看后可能由于源文件缺失无法正常显示。图1 查看SQL执行计划父主题：使用DLI提交SQL作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
离线Compaction配置 - 数据湖探索 DLI

run archivelog on $tablename; // 执行archivelog合并清理元数据文件关于清理、归档参数的值不宜设置过大，会影响Hudi表的性能，通常建议： hoodie.cleaner.commits.retained =

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
BlackHole - 数据湖探索 DLI
BlackHole - 数据湖探索 DLI

后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据语法格式 create table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Flink作业常用操作 - 数据湖探索 DLI

选择需导入的作业配置文件的完整OBS路径。单击“下一步”。配置同名作业策略。单击“下一步”。勾选“配置同名替换”，如果待导入的作业名已存在，则覆盖已存在的作业配置，并且作业状态重置为草稿。不勾选“配置同名替换”，如果待导入的作业名已存在，则不导入同名作业的配置。确认“配置文件”和“同

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

否 String 队列计算资源的cpu架构。 x86_64 aarch64 默认值为x86_64。说明： aarch64架构计算资源使用华为鲲鹏系列服务器。 resource_mode 否 Integer 队列资源模式。支持以下两种类型： 0：共享资源模式 1：专属资源模式 labels

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

PARTITION时指定了分区保存路径，那么在DROP PARTITION执行后，分区所在文件夹和数据不会被删除。如果ADD PARTITION时未指定分区保存路径，分区目录将从OBS上删除，数据会移到.Trash/Current文件夹。 ALTER TABLE table_name DROP [IF

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法

总条数： 631

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建增强型跨源连接 - 数据湖探索 DLI

查看Delta表历史操作记录 - 数据湖探索 DLI

FileSystem源表 - 数据湖探索 DLI

Spark开源命令支持说明 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

DESCRIBE - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

查看SQL执行计划 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

BlackHole - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线