搜索_华为云

Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi存储结构 Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
Hudi Compaction操作说明 - 数据湖探索 DLI

Hudi Compaction操作说明什么是Compaction Compaction用于合并mor表Base和Log文件，Compaction包含两个过程Schedule和Run。Schedule过程会在TimeLine里生成一个Compaction Plan，这个Compaction

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启）操作场景本节操作介绍创建Flink作业时，配置流应用实现高可靠性能的操作方法。操作步骤用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
比较函数 - 数据湖探索 DLI
比较函数 - 数据湖探索 DLI

比较函数表1 比较函数 SQL函数返回类型描述 value1 = value2 BOOLEAN 如果 value1 等于 value2 返回 TRUE；如果 value1 或者 value2 为 NULL 返回 UNKNOWN。 value1 <> value2 BOOLEAN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
ROLLUP - 数据湖探索 DLI
ROLLUP - 数据湖探索 DLI

ROLLUP 功能描述 ROLLUP生成聚合行、超聚合行和总计行。可以实现从右到左递减多级的统计，显示统计某一层次结构的聚合。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference GROUP BY col_name_list

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
按列GROUP BY - 数据湖探索 DLI
按列GROUP BY - 数据湖探索 DLI

按列GROUP BY 功能描述按列对表进行分组操作。语法格式 1 2 SELECT attr_expr_list FROM table_reference GROUP BY col_name_list; 关键字 GROUP BY：按列可分为单列GROUP BY与多列GROUP

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业本章节主要介绍从创建弹性资源池、创建增强型跨源、添加队列到弹性资源池并运行作业的一个完整流程，帮助您更好、更方便的使用弹性资源池。图1 创建弹性资源池运行作业流程图表1 创建新队列时绑定弹性资源池流程说明阶段说明参考文档步骤一：创建弹性资源池

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

DLI跨源连接报错找不到子网怎么办？问题现象跨源连接创建对等连接失败，报错信息如下： Failed to get subnet 2c2bd2ed-7296-4c64-9b60-ca25b5eee8fe. Response code : 404, message : {"code":"VPC

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Hudi数据表Compaction规范 - 数据湖探索 DLI

Hudi数据表Compaction规范 mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误问题现象在DLI上提交Flink SQL作业，作业运行失败，在作业日志中有如下报错信息：

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
增强型跨源连接绑定队列失败怎么办？ - 数据湖探索 DLI

增强型跨源连接绑定队列失败怎么办？问题现象客户创建增强型跨源连接后，在队列管理测试网络连通性，网络不通，单击对应的跨源连接查看详情，发现绑定队列失败，报错信息如下： Failed to get subnet 86ddcf50-233a-449d-9811-cfef2f603213

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
二进制函数和运算符 - 数据湖探索 DLI

二进制函数和运算符二进制运算符 || 运算符执行连接。二进制函数 length(binary) → bigint 返回binary的字节长度。 select length(x'00141f');-- 3 concat(binary1, ..., binaryN) → varbinary

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
SHOW_COMMIT_FILES - 数据湖探索 DLI
SHOW_COMMIT_FILES - 数据湖探索 DLI

SHOW_COMMIT_FILES 命令功能查看指定的instant一共更新或者插入了多个文件。命令格式 call show_commit_files(table=>'[table]', instant_time=>'[instant_time]', limit=>[limit]);

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
创建DLI表关联CSS - 数据湖探索 DLI

创建DLI表关联CSS 功能描述使用CREATE TABLE命令创建DLI表并关联CSS上已有的表。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 AOM服务提供的Prometheus监控是一种全面对接开源Prometheus生态的监控解决方案。它支持多种类型的组件监控，提供预置监控大盘和全面托管的Prometheus服务，通过Prometheus监控来统一采集、存储和显示监控

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 DBT（Data Build Tool），是一款开源的数据建模和转换工具，运行在Python环境上。DBT连接DLI，用来定义和执行SQL转换，支持从数据集成、转换到分析的整个数据生命周期管理，适用于大规模数据分析项目和复杂的数据分析场景。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移Elasticsearch类型的CSS集群数据至DLI。其他自建的Elasticsearch等服务数据，均可以通过CDM与DLI进行双向同步。前提条件已创建DLI的SQL队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
GROUPING SETS - 数据湖探索 DLI
GROUPING SETS - 数据湖探索 DLI

GROUPING SETS 功能描述 GROUPING SETS生成交叉表格行，可以实现GROUP BY字段的交叉统计。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference GROUP BY col_name_list

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

Spark作业相关完整样例代码和依赖包说明请参考：Python SDK概述。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK

总条数： 889

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi存储结构 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

比较函数 - 数据湖探索 DLI

ROLLUP - 数据湖探索 DLI

按列GROUP BY - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

增强型跨源连接绑定队列失败怎么办？ - 数据湖探索 DLI

二进制函数和运算符 - 数据湖探索 DLI

SHOW_COMMIT_FILES - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

GROUPING SETS - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线