搜索_华为云

Hudi数据表Compaction规范 - 数据湖探索 DLI

要求Compaction执行合并的过程必须和实时任务解耦，通过周期调度Spark任务来完成异步Compaction，这个方案的关键之处在于如何合理的设置这个周期，周期如果太短意味着Spark任务可能会空跑，周期如果太长可能会积压太多的Compaction Plan没有去执行而导致

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

在SQL作业编辑器执行的SQL语句、导入数据和导出数据等操作，在系统中对应的执行实体，称之为SQL作业。 SQL作业适用于使用标准SQL语句进行查询的场景。通常用于结构化数据的查询和分析。 Flink作业 Flink作业专为实时数据流处理设计，适用于低时延、需要快速响应的场景。适用于实时监控、在线分析等场景。

帮助中心 > 数据湖探索 DLI > 产品介绍
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

) CUBE ( column [, ...] ) ROLLUP ( column [, ...] ) 描述从零个或多个表中检索行数据。查询stu表的内容。 SELECT id,name FROM stu; 父主题： DQL 语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
JOINS - 数据湖探索 DLI
JOINS - 数据湖探索 DLI

nation ,region WHERE nation.name=region.name; OUTER JOIN OUTER JOIN返回符合查询条件的行的同时也返回不符合的行，分为以下三类：左外连接：LEFT JOIN或LEFT OUTER JOIN，表示以左表（nation）为

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
通过DLI跨源写DWS表，非空字段出现空值异常怎么办？ - 数据湖探索 DLI

原因分析 DLI源表对应字段cir为double类型。图1 创建源表目标表对应字段类型为decimal(9,6)。图2 创建目标表查询源表数据，发现导致问题产生的记录ctr值为1675，整数位（4位）超出所定义的decimal精度（9 – 6 = 3位），导致double

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
创建并使用跨源链接 - 数据湖探索 DLI

onnections/{connection_id} {project_id}信息请从获取项目ID获取。查询参数说明详情，请参见创建数据库（废弃）。请求示例描述：查询项目ID为48cc2c48765f481480c7db940d6409d1下连接ID为2a620c33-56

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

已创建DLI访问DEW的委托并完成委托授权。该委托需具备以下权限： DEW中的查询凭据的版本与凭据值ShowSecretVersion接口权限，csms:secretVersion:get。 DEW中的查询凭据的版本列表ListSecretVersions接口权限，csms:secretVersion:list。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
按列GROUP BY - 数据湖探索 DLI
按列GROUP BY - 数据湖探索 DLI

以使用多个聚合函数，比如count()，sum()，聚合函数中可以包含其他字段。多列GROUP BY：指GROUP BY子句中不止一列，查询语句将按照GROUP BY的所有字段分组，所有字段都相同的记录将被放在同一组中，同样，GROUP BY中出现的字段必须在attr_expr

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
还原Delta表到早期状态 - 数据湖探索 DLI

timestamp_expression 时间戳，不能晚于当前时间，格式'yyyy-MM-ddTHH:mm:ss.SSS' version_code 1.3.1中查询结果中的版本号示例 RESTORE delta_table0 TO TIMESTAMP AS OF '2020-10-18T22:15:12

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
修改表分区位置（只支持OBS表） - 数据湖探索 DLI

若新增分区指定的路径包含子目录（或嵌套子目录），则子目录下面的所有文件类型及内容也将作为该分区的记录。用户需要保证该分区目录下所有文件类型和文件内容与表的字段一致，否则查询将报错。示例将student表的分区dt='2008-08-08',city='xxx'的OBS路径设置为“obs://bucketN

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

算的随机值之间的比较）。结果中包含一行的概率与任何其他行无关。这不会减少从磁盘读取采样表所需的时间。如果进一步处理采样输出，则可能会影响总查询时间。 SELECT * FROM users TABLESAMPLE BERNOULLI (50); SYSTEM 此采样方法将表划分为

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Spark 3.1.1版本说明 - 数据湖探索 DLI

【SPARK-21492】：修复排序合并加入中的内存泄漏。【SPARK-27812】：K8S客户端版本提升到4.6.1。 DLI从Spark 3.x版本开始不支持内置地理空间查询函数。父主题：版本支持公告

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

dPayload。 useCache 是否在Spark中缓存表的relation，无需用户配置。为支持SparkSQL中对COW表增量视图查询，默认将COW表中该值置为false。示例创建非分区表 create table if not exists hudi_table0 (

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
使用DataSource语法创建DLI表 - 数据湖探索 DLI

用于CTAS命令，将源表的select查询结果或某条数据插入到新创建的DLI表中。表2 OPTIONS参数描述参数是否必选描述默认值 multiLevelDirEnable 否是否迭代查询子目录中的数据。当配置为true时，查询该表时会迭代读取该表路径中所有文件，包含子目录中的文件。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
SHOW TABLES - 数据湖探索 DLI
SHOW TABLES - 数据湖探索 DLI

Table ------------- show_table1 show_table2 (2 rows) --同时满足多个条件，查询default中'show_'开头或者'in'开头的表 show tables in default like 'show$_%|in%'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
数据赋权（用户）（废弃） - 数据湖探索 DLI

系统提示信息，执行成功时，信息可能为空。示例值：空。请求示例赋予用户user2数据库db1的查询权限、数据表db1.tbl的删除权限、数据表指定列db1.tbl.column1的查询权限 { "user_name": "user2", "action": "grant"

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

grade.science[1]'), JSON_VAL(message,'$.grade.dddd') from kafkaSource; 查看taskmanager的out文件的输出结果 +I[null, James, [80,85], [80,85], 85, null] 父主题：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
字符类型 - 数据湖探索 DLI
字符类型 - 数据湖探索 DLI

binary_tb(col1 BINARY); -- 插入数据 INSERT INTO binary_tb values (X'63683F'); --查询数据 select * from binary_tb ; -- 63 68 3f 在做CHAR 数值比较的时候，在对两个仅尾部空格数不

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
本文样例表数据准备 - 数据湖探索 DLI

--插入一条Map类型数据 insert into map_tb values(MAP(ARRAY['foo','bar'],ARRAY[1,2])); --查询数据 select * from map_tb; -- {bar=2, foo=1} --创建ROW表 create table row_tb

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > 附录
SparkSQL建表参数规范 - 数据湖探索 DLI

hive_sync.enable指定为false。指定为false将导致新写入的分区无法同步到Hive Metastore中。由于缺失新写入的分区信息，查询引擎读取该时会丢数。禁止指定Hudi的索引类型为INMEMORY类型。该索引仅是为了测试使用。生产环境上使用该索引将导致数据重复。建表示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范

总条数： 777

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Compaction规范 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

JOINS - 数据湖探索 DLI

通过DLI跨源写DWS表，非空字段出现空值异常怎么办？ - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

按列GROUP BY - 数据湖探索 DLI

还原Delta表到早期状态 - 数据湖探索 DLI

修改表分区位置（只支持OBS表） - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

Spark 3.1.1版本说明 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

SHOW TABLES - 数据湖探索 DLI

数据赋权（用户）（废弃） - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

字符类型 - 数据湖探索 DLI

本文样例表数据准备 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线