搜索_华为云

程序包管理概述 - 数据湖探索 DLI

程序包程序包支持删除，但不支持删除程序包组。支持上传的程序包类型： JAR：用户jar文件。 PyFile：用户Python文件。 File：用户文件。 ModelFile：用户AI模型文件。程序包管理页面表2 程序包管理参数参数参数说明分组名称程序包所属分组的名称。如果不分组，则显示“--”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Hudi Archive操作说明 - 数据湖探索 DLI

Archive用户清理Hudi表的元数据文件（位于.hoodie目录下，格式为 ${时间戳}.${操作类型}.${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多会导致性能问题，所以元数据文件数量最好控制在1000以内。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
使用Hive语法创建OBS表 - 数据湖探索 DLI

obs_path 是数据文件所在的OBS存储路径，推荐使用OBS并行文件系统存储。格式：obs://bucketName/tblPath bucketName即桶名称。 tblPath是目录名称。目录后不需要指定文件名。当OBS的目录下文件夹与文件同名时，创建OBS表指向的路径会优先指向文件而非文件夹。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用DataSource语法创建OBS表 - 数据湖探索 DLI

更多建表时的属性名与属性值请参考表2。 file_format为csv时表的属性名与属性值请参考表2和表3。当OBS的目录下文件夹与文件同名时，创建OBS表指向的路径会优先指向文件而非文件夹。 table_comment 否表描述信息。仅支持字符串常量。 select_statement 否用于CTAS命令，将

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Hudi Clean操作说明 - 数据湖探索 DLI

Hudi Clean操作说明什么是Clean Cleaning用于清理Hudi表不再需要的老版本数据文件 (parquet文件或者log文件)，减轻存储压力，提升list操作效率。如何执行Clean 写完数据后clean Spark SQL（设置如下参数，随后执行任意写入SQL时，在满足条件时触发）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Hudi Compaction操作说明 - 数据湖探索 DLI

Plan一个一个去执行，一直到全部都执行完。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-On-Read表可减少数据摄入延迟，因而进行不阻塞摄入的异步Compaction很有意义。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Delta清理和优化 - 数据湖探索 DLI

前创建的数据文件。 VACUUM delta_table0; VACUUM delta_table0 RETAIN 168 HOURS;--单位只支持HOURS 优化Delta表为了提高查询速度，Delta Lake支持优化数据在存储中的布局，这会将许多较小的文件压缩为较大的文件。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
FileSytem结果表 - 数据湖探索 DLI

FileSytem结果表功能描述 FileSystem结果表用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。数据生成后，可直接对生成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

ies中都需要指定truststore文件的路径。初始化consumer/producer都是在taskmanager里执行的，所以需要获取到taskmanager对应container下truststore文件的路径，在初始化前将其引入properties中才能生效。 kafka

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
对象存储OBS结果表 - 数据湖探索 DLI

uid会重新生成。文件合并 FileSink 开始支持已经提交Pending文件的合并，从而允许应用设置一个较小的时间周期并且避免生成大量的小文件。这一功能开启后，在文件转为Pending状态与文件最终提交之间会进行文件合并。这些Pending状态的文件将首先被提交为一个以.

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
Hudi表使用约束 - 数据湖探索 DLI

写时复制表也简称COW表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
FileSystem结果表 - 数据湖探索 DLI

uid会重新生成。文件合并 FileSink 开始支持已经提交Pending文件的合并，从而允许应用设置一个较小的时间周期并且避免生成大量的小文件。这一功能开启后，在文件转为Pending状态与文件最终提交之间会进行文件合并。这些Pending状态的文件将首先被提交为一个以.

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

COMPACTION 命令功能压缩( compaction)用于在 MergeOnRead表将基于行的log日志文件转化为parquet列式数据文件，用于加快记录的查找。命令格式 SCHEDULE COMPACTION on tableIdentifier |tablelocation;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
file - 数据湖探索 DLI
file - 数据湖探索 DLI

file_path 格式无。说明文件路径，该路径是OBS路径。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

DELTA 命令将现有的 Parquet 表就地转换为 Delta 表。此命令会列出目录中的所有文件，创建 Delta Lake 事务日志来跟踪这些文件，并通过读取所有 Parquet 文件的页脚来自动推断数据架构。转换过程会收集统计信息，以提升转换后的 Delta 表的查询性能。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
SHALLOW CLONE - 数据湖探索 DLI
SHALLOW CLONE - 数据湖探索 DLI

被克隆的信息包括：schema、分区信息、数据文件路径等。对克隆表所做的任何更改都只会影响克隆本身，而不会影响源表，只要它们不触及源数据。注意克隆表可能仍会指向源表的数据文件，当源表做了vacuum操作时，可能导致克隆表找不到文件。命令格式 CREATE TABLE [target_db

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie // 元数据文件夹 │ ├── .aux │ ├── .cleanData

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
配置DLI作业桶 - 数据湖探索 DLI

操作前准备配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

故障处理问题1：将代码直接复制到py文件中后，'\'后出现“unexpected character”问题。问题将代码直接复制到py文件中后，'\'后出现“unexpected character”问题。解决方案将'\'后面的缩进或是空格全部删除。父主题：对接Redis

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
用户通过CTAS创建hive表报schema解析异常错误 - 数据湖探索 DLI

目前DLI支持hive语法创建TEXTFILE、SEQUENCEFILE、RCFILE、ORC、AVRO、PARQUET文件类型的表。如果用户CTAS建表指定的文件格式为AVRO类型，而且直接使用数字作为查询语句（SELECT）的输入，如“CREATE TABLE tb_avro STORED

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类

总条数： 324

上一页
1
2
3
4
5
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

程序包管理概述 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

Delta清理和优化 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

file - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

SHALLOW CLONE - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

用户通过CTAS创建hive表报schema解析异常错误 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线