搜索_华为云

MERGE INTO - 数据湖探索 DLI
MERGE INTO - 数据湖探索 DLI

MERGE INTO 命令功能通过MERGE INTO命令，根据一张表或子查询的连接条件对另外一张表进行查询，连接条件匹配上的进行UPDATE或DELETE，无法匹配的执行INSERT。这个语法仅需要一次全表扫描就完成了全部同步工作，执行效率要高于INSERT＋UPDATE。注意事项

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Spark 3.3.1版本说明 - 数据湖探索 DLI

支持容器集群Spark日志跳转查看需要在容器查看日志。支持动态加载UDF（公测）无需重启队列UDF即可生效。 Spark UI支持火焰图 Spark UI支持绘制火焰图。优化SQL作业NOT IN语句查询性能 NOT IN语句查询性能提升。优化Multi-INSERT语句查询性能 Multi-INSERT语句查询性能提升。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

已购买套餐包，为什么仍然产生按需计费？问题描述已经购买了DLI的套餐包，使用过程中仍然产生了按需费用。排查思路 DLI提供优惠的资源套餐包，购买套餐包后，资源按照套餐包类型计费。套餐包是用户预先购买的资源使用量配额，超出当前套餐包的额度，将自动转为按需收费。建议您按以下顺序排查原因。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
conv - 数据湖探索 DLI
conv - 数据湖探索 DLI

参数to_base格式为浮点数格式、整数格式、字符串格式。返回值说明返回STRING类型。 num、from_base或to_base值为NULL时，返回NULL。转换过程以64位精度工作，溢出时返回NULL。 num如果输入的是小数，会转为整数值后进行进制转换，小数部分会被舍弃。示例代码 -返回8。 select

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
列别名 - 数据湖探索 DLI
列别名 - 数据湖探索 DLI

AS：是否添加此关键字不会影响结果。注意事项所要查询的表必须是已经存在的，否则会出错。别名的命名必须在别名的使用之前，否则会出错。此外，建议不要重名。示例先通过子查询SELECT name AS n FROM simple_table WHERE score > 90获得结果，在子查询中给name起的别名n可直接用于外部SELECT语句。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 别名SELECT
UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

[DISTINCT] query INTERSECT仅返回第一个和第二个查询的结果相交的行。以下是最简单的INTERSECT子句之一的示例。它选择值13和42，并将此结果集与选择值13的第二个查询合并。由于42仅在第一个查询的结果集中，因此不包含在最终结果中。 SELECT * FROM

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

BY里，每个分组只输出一条记录，包括以下几种：分组函数在流处理表中的 SQL 查询中，分组窗口函数的 time_attr 参数必须引用一个合法的时间属性，且该属性需要指定行的处理时间或事件时间。对于批处理的 SQL 查询，分组窗口函数的 time_attr 参数必须是一个 TIMESTAMP

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

子句，HAVING 的存在也会使查询变成一个分组查询。这与查询包含聚合函数但没有 GROUP BY 子句时的情况相同。查询认为所有被选中的行形成一个单一的组，并且 SELECT 列表和 HAVING 子句只能从聚合函数中引用列。如果 HAVING 条件为真，这样的查询将发出一条记录，如果不为真，则发出零条记录。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Hudi表索引设计规范 - 数据湖探索 DLI

Bucket索引：在写入数据过程中，通过主键进行Hash计算，将数据进行分桶写入；该索引写入速度最快，但是需要合理配置分桶数目；Flink、Spark均支持该索引写入。状态索引：Flink引擎独有索引，是将行记录的存储位置记录到状态后端的一种索引形式，在作业冷启动过程中会遍历所有数据存储文件生成索引信息。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
HAVING - 数据湖探索 DLI
HAVING - 数据湖探索 DLI

HAVING 功能描述在HAVING子句中嵌套子查询，子查询结果将作为HAVING子句的一部分。语法格式 1 2 3 SELECT [ALL | DISTINCT] attr_expr_list FROM table_reference GROUP BY groupby_expression

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
Delta清理和优化 - 数据湖探索 DLI

delta_table0; VACUUM delta_table0 RETAIN 168 HOURS;--单位只支持HOURS 优化Delta表为了提高查询速度，Delta Lake支持优化数据在存储中的布局，这会将许多较小的文件压缩为较大的文件。 optimize delta_table0;

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

INSERT INTO 命令功能 INSERT命令用于将SELECT查询结果加载到Hudi表中。命令格式 INSERT INTO tableIndentifier select query; 参数描述表1 INSERT INTO参数参数描述 tableIndentifier

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
SHOW_COMMIT_FILES - 数据湖探索 DLI
SHOW_COMMIT_FILES - 数据湖探索 DLI

由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。系统响应可以检查任务状态是否成功，查看任务结果，查看任务日志确认有无异常。父主题： Hudi CALL COMMAND语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
BI工具连接DLI方案概述 - 数据湖探索 DLI

BI，可以直接通过DLI提供的驱动连接到DLI。这简化了配置过程，使得用户能够直接利用这些工具的强大功能。 PowerBI、Fine BI、SuperSet、Tableau和Beeline，它们可以通过Kyuubi建立与DLI的连接。Kyuubi是一个分布式SQL查询引擎，提供了标准的SQL接口，使得B

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
弹性资源池规格变更 - 数据湖探索 DLI

时计费的方式计费，您可以根据实际CU的使用情况通过规格变更来使得计费更优惠。例如，当前弹性资源池的规格（包周期CU）为64CU，实际使用过程中大部分时间CU数在128CU以上，没有规格变更的场景下64CU部分采用包年包月计费，超出的64CU按弹性资源池CU时计费方式计费。为了满

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
OpenTSDB结果表 - 数据湖探索 DLI
OpenTSDB结果表 - 数据湖探索 DLI

OpenTSDB是基于HBase分布式的，可伸缩的时间序列数据库。OpenTSDB的设计目标是用来采集大规模集群中的监控类信息，并可实现数据的秒级查询，解决海量监控类数据在普通数据库中查询存储的局限性，可用于系统监控和测量、物联网数据、金融数据和科学实验结果数据的收集监控。 DLI可以通过增强型跨源连接功能

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hudi数据表Clean规范 - 数据湖探索 DLI

对于MOR表和COW表都需要执行。Clean操作的目的是为了清理旧版本文件（Hudi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean。对于Hudi的MOR、COW表，都需要开启Clean。 Hudi表在写

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
创建DLI表关联DCS - 数据湖探索 DLI

对应Redis中的Key或Hash Key。插入redis数据时必填。查询redis数据时与“keys.pattern”参数二选一。 keys.pattern 使用正则表达式匹配多个Key或Hash Key。该参数仅用于查询时使用。查询redis数据时与“table”参数二选一。 key.column

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
配置DLI程序包权限 - 数据湖探索 DLI

更新组：更新该组内程序包，包含创建组内程序包。查询组：查询组内程序包详情。删除组：删除该组的程序包。赋权：当前用户可将组的权限赋予其他用户。回收：当前用户可回收其他用户具备的该组的权限，但不能回收该组所有者的权限。查看其他用户具备的权限：当前用户可查看其他用户具备的该组的权限。程序包授权

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

SV数据转换为Parquet数据。方案优势提升查询性能如果您在HDFS上拥有基于文本的数据文件或者表，而且正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的提升在某些情况下可能达到约30倍或更高。节省存储空间

 帮助中心 > 数据湖探索 DLI > 最佳实践

总条数： 747

上一页
1
...
7
8
9
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MERGE INTO - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

conv - 数据湖探索 DLI

列别名 - 数据湖探索 DLI

UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

HAVING - 数据湖探索 DLI

Delta清理和优化 - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

SHOW_COMMIT_FILES - 数据湖探索 DLI

BI工具连接DLI方案概述 - 数据湖探索 DLI

弹性资源池规格变更 - 数据湖探索 DLI

OpenTSDB结果表 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线