搜索_华为云

Hudi Compaction操作说明 - 数据湖探索 DLI

Hudi Compaction操作说明什么是Compaction Compaction用于合并mor表Base和Log文件，Compaction包含两个过程Schedule和Run。Schedule过程会在TimeLine里生成一个Compaction Plan，这个Compaction

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
FROM - 数据湖探索 DLI
FROM - 数据湖探索 DLI

FROM 功能描述在FROM子句中嵌套子查询，子查询的结果作为中间过渡表，进而作为外部SELECT语句的数据源。语法格式 1 SELECT [ALL | DISTINCT] attr_expr_list FROM (sub_query) [alias]; 关键字 ALL：返

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi存储结构 Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
ROLLUP - 数据湖探索 DLI
ROLLUP - 数据湖探索 DLI

ROLLUP 功能描述 ROLLUP生成聚合行、超聚合行和总计行。可以实现从右到左递减多级的统计，显示统计某一层次结构的聚合。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference GROUP BY col_name_list

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
Flink作业推荐配置指导 - 数据湖探索 DLI

Flink作业推荐配置指导用户在创建Flink作业时，可以通过如下配置实现流应用的高可靠性能。用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。图1 创建主题图2

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业本章节主要介绍从创建弹性资源池、创建增强型跨源、添加队列到弹性资源池并运行作业的一个完整流程，帮助您更好、更方便的使用弹性资源池。图1 创建弹性资源池运行作业流程图表1 创建新队列时绑定弹性资源池流程说明阶段说明参考文档步骤一：创建弹性资源池

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
比较函数 - 数据湖探索 DLI
比较函数 - 数据湖探索 DLI

比较函数表1 比较函数 SQL函数返回类型描述 value1 = value2 BOOLEAN 如果 value1 等于 value2 返回 TRUE；如果 value1 或者 value2 为 NULL 返回 UNKNOWN。 value1 <> value2 BOOLEAN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
按列GROUP BY - 数据湖探索 DLI
按列GROUP BY - 数据湖探索 DLI

按列GROUP BY 功能描述按列对表进行分组操作。语法格式 1 2 SELECT attr_expr_list FROM table_reference GROUP BY col_name_list; 关键字 GROUP BY：按列可分为单列GROUP BY与多列GROUP

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
二进制函数和运算符 - 数据湖探索 DLI

二进制函数和运算符二进制运算符 || 运算符执行连接。二进制函数 length(binary) → bigint 返回binary的字节长度。 select length(x'00141f');-- 3 concat(binary1, ..., binaryN) → varbinary

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Hudi数据表Compaction规范 - 数据湖探索 DLI

Hudi数据表Compaction规范 mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
SHOW_COMMIT_FILES - 数据湖探索 DLI
SHOW_COMMIT_FILES - 数据湖探索 DLI

SHOW_COMMIT_FILES 命令功能查看指定的instant一共更新或者插入了多个文件。命令格式 call show_commit_files(table=>'[table]', instant_time=>'[instant_time]', limit=>[limit]);

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
创建DLI表关联CSS - 数据湖探索 DLI

创建DLI表关联CSS 功能描述使用CREATE TABLE命令创建DLI表并关联CSS上已有的表。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 AOM服务提供的Prometheus监控是一种全面对接开源Prometheus生态的监控解决方案。它支持多种类型的组件监控，提供预置监控大盘和全面托管的Prometheus服务，通过Prometheus监控来统一采集、存储和显示监控

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
配置DLI作业桶 - 数据湖探索 DLI

配置DLI作业桶使用DLI服务前需配置DLI作业桶，该桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台的“全局配置 > 工程配置”页面配置DLI作业桶。操作前准备配置前，请先购买OBS桶或并行文件系统。大数据场景推

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
GROUPING SETS - 数据湖探索 DLI
GROUPING SETS - 数据湖探索 DLI

GROUPING SETS 功能描述 GROUPING SETS生成交叉表格行，可以实现GROUP BY字段的交叉统计。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference GROUP BY col_name_list

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移Elasticsearch类型的CSS集群数据至DLI。其他自建的Elasticsearch等服务数据，均可以通过CDM与DLI进行双向同步。前提条件已创建DLI的SQL队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
SHALLOW CLONE - 数据湖探索 DLI
SHALLOW CLONE - 数据湖探索 DLI

SHALLOW CLONE 命令功能 SHALLOW CLONE 命令在特定版本创建现有Delta表的浅拷贝。被克隆的信息包括：schema、分区信息、数据文件路径等。对克隆表所做的任何更改都只会影响克隆本身，而不会影响源表，只要它们不触及源数据。注意克隆表可能仍会指向源表的数

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
创建DLI表关联OpenTSDB - 数据湖探索 DLI

创建DLI表关联OpenTSDB 功能描述使用CREATE TABLE命令创建DLI表并关联OpenTSDB上已有的metric，该语法支持CloudTable服务的OpenTSDB和MRS服务的OpenTSDB。前提条件创建DLI表关联OpenTSDB之前需要创建跨源连接。管理控制台操作请参考增强型跨源连接。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表
导出SQL作业结果 - 数据湖探索 DLI

导出SQL作业结果导出作业结果是将SQL作业分析后的数据结果按指定格式存储到指定位置。 DLI默认将SQL作业结果存储在DLI作业桶中。同时也支持下载作业结果到本地或导出作业结果到指定的OBS桶。导出作业结果到DLI作业桶 DLI在指定了一个默认的OBS桶作为作业结果的存储位置，请在DLI管理控制台的“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DLI计算引擎版本生命周期 - 数据湖探索 DLI

DLI计算引擎版本生命周期版本号说明 DLI计算引擎版本号：格式为计算引擎名称 x.y.z，其中计算引擎分为Flink和Spark，版本号具体含义如图1所示。图1 DLI计算引擎版本号版本支持情况 Flink计算引擎推荐版本：Flink 1.15。 Spark计算引擎推荐版本：

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告

总条数： 957

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Compaction操作说明 - 数据湖探索 DLI

FROM - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

ROLLUP - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

比较函数 - 数据湖探索 DLI

按列GROUP BY - 数据湖探索 DLI

二进制函数和运算符 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

SHOW_COMMIT_FILES - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

GROUPING SETS - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

SHALLOW CLONE - 数据湖探索 DLI

创建DLI表关联OpenTSDB - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

DLI计算引擎版本生命周期 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线