搜索_华为云

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

DLI表与OBS表有什么区别？ DLI表表示数据存储在本服务内部，用户不感知数据存储路径。 OBS表表示数据存储在用户自己账户的OBS桶中，源数据文件由用户自己管理。 DLI表相较于OBS表提供了更多权限控制和缓存加速的功能，性能相较于外表性能更好，但是会收取存储费用。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
查看Delta表历史操作记录 - 数据湖探索 DLI

isolationLevel 隔离级别 isBlindAppend 是否追加数据 operationMetrics 操作的度量（例如，修改的文件数、行数、字节数等信息） engineInfo Spark和Delta版本信息父主题： Delta Time Travel

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
Spark开源命令支持说明 - 数据湖探索 DLI

DATABASE testDB SET DBPROPERTIES ('Edited-by' = 'John'); 不支持不支持修改数据库在OBS上的文件存放路径 ALTER DATABASE testDB SET LOCATION 'obs://bucketName/filePath'; 不支持

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

range 0 = 0 to 479 while trying to read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
配置Flink作业权限 - 数据湖探索 DLI

表1 Flink作业授权参数说明参数名称描述用户名被授权用户的名称。说明：该用户名称是已存在的IAM用户名称。并且该用户需要登录过华为云，才能进行授权操作。权限设置全选：所有的权限都勾选上。查看作业详情：查看此作业的作业详情。更新作业：编辑修改此作业。删除作业：删除此作业。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

SQL作业分析数据。准备工作已注册华为账号并开通华为云，且在使用DLI前检查账号状态，账号不能处于欠费或冻结状态。配置DLI委托访问授权 DLI使用过程中涉及到OBS、VPC、SMN等服务交互，首次使用DLI需要用户配置委托授权，允许访问这些依赖服务。使用华为云账号登录DLI管理控制台，在左侧导航栏单击“全局配置

 帮助中心 > 数据湖探索 DLI > 快速入门
FileSystem源表 - 数据湖探索 DLI
FileSystem源表 - 数据湖探索 DLI

connector 是无 String 固定位filesystem。 path 是无 String OBS路径。 format 是无 String 文件格式。支持csv、parquet格式。常见问题无父主题：创建源表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
数据迁移与传输方式概述 - 数据湖探索 DLI

LI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。具体操作请参考迁移外部数据源数据至DLI。图1 迁移数据至DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

format 是（none） String 指定使用格式，这里应该是'avro'。 avro.codec 否（none） String 仅用于文件系统，avro 压缩编解码器。默认不压缩。目前支持：deflate、snappy、bzip2、xz。数据类型映射目前，Avro schema

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
创建并提交SQL作业 - 数据湖探索 DLI

当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DESCRIBE - 数据湖探索 DLI
DESCRIBE - 数据湖探索 DLI

createdAt 建表时间戳 lastModified 最后一次修改的时间戳 partitionColumns 分区列 numFiles 表的最新版本中的文件个数 sizeInBytes 表的最新快照的大小（以字节为单位） properties 为此表设置的所有属性 minReaderVersion

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

OVERWRITE、TRUNCATE TABLE）时是否清除相关数据： "auto.purge"='true'时，清除元数据和数据文件。 "auto.purge"='false'时，仅清除元数据，数据文件会移入OBS回收站。默认值为“false”，且不建议用户修改此属性，避免数据删除后无法恢复。 CREATE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Spark SQL常用配置项说明 - 数据湖探索 DLI

批作业SQL语法的常用配置项。表1 常用配置项名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Upsert Kafka源表 - 数据湖探索 DLI

单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。数据结果参考如下： +I(202103251202020001

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <ar

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Notebook相关操作请参考JupyterLab简介及常用操作。 Notebook中的数据上传请参考上传文件至JupyterLab。 Notebook中的数据下载请参考下载JupyterLab文件到本地。（可选）配置Notebook访问DLI元数据在完成DLI和Notebook的对接后

 帮助中心 > 数据湖探索 DLI > 用户指南
离线Compaction配置 - 数据湖探索 DLI

run archivelog on $tablename; // 执行archivelog合并清理元数据文件关于清理、归档参数的值不宜设置过大，会影响Hudi表的性能，通常建议： hoodie.cleaner.commits.retained =

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
BlackHole - 数据湖探索 DLI
BlackHole - 数据湖探索 DLI

后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据语法格式 create table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
查看SQL执行计划 - 数据湖探索 DLI

系统从DLI作业桶中查询对应作业的SQL执行计划并展示在控制台页面。如果DLI作业桶中的SQL执行计划已经删除，那么点击查看后可能由于源文件缺失无法正常显示。图1 查看SQL执行计划父主题：使用DLI提交SQL作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

PARTITION时指定了分区保存路径，那么在DROP PARTITION执行后，分区所在文件夹和数据不会被删除。如果ADD PARTITION时未指定分区保存路径，分区目录将从OBS上删除，数据会移到.Trash/Current文件夹。 ALTER TABLE table_name DROP [IF

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法

总条数： 610

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

查看Delta表历史操作记录 - 数据湖探索 DLI

Spark开源命令支持说明 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

FileSystem源表 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

DESCRIBE - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

BlackHole - 数据湖探索 DLI

查看SQL执行计划 - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线