搜索_华为云

分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

窗口不会产生状态过大的问题。可以提供一个合适的状态 time-to-live (TTL) 配置来防止状态过大。注意：这可能会影响查询结果的正确性。更多介绍和使用请参考开源社区文档：分组聚合。 DISTINCT 聚合 DISTINCT 聚合在聚合函数前去掉重复的数据。下面的示例计算 Orders 表中不同

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
CLUSTERING - 数据湖探索 DLI
CLUSTERING - 数据湖探索 DLI

'2021-08-28'", order => 'id'); 注意事项 table与path参数必须存在一个，否则无法判断需要执行clustering的表。使用由DLI提供的元数据服务时，本命令仅支持配置table参数，不支持配置path参数。如果需要对指定分区进行clustering，参考格式：predicate

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

(VALUES 13, 42) EXCEPT SELECT 13; _col0 ------- 42 (1 row) Having子句目前不支持使用列的别名，例如： select count(userid) as num ,dept as aaa from salary group by

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

改，不支持从checkpoint恢复。应用场景本文列举了一些常见的从checkpoint恢复的场景供您参考，如表1所示。更多场景可以使用从checkpoint恢复的原则结合实际情况进行判断。表1 从checkpoint恢复的常见场景场景是否支持恢复说明调整或者增加并行数

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
检查SQL语法 - 数据湖探索 DLI
检查SQL语法 - 数据湖探索 DLI

"job_type":"QUERY" } 状态码状态码如表4所示。表4 状态码状态码描述 200 请求成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： SQL作业相关API

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
返回结果 - 数据湖探索 DLI
返回结果 - 数据湖探索 DLI

对于获取用户Token接口，接口，返回如图1所示的消息头，其中“x-subject-token”就是需要获取的用户Token。有了Token之后，您就可以使用Token认证调用其他API。图1 获取用户Token响应消息头响应消息体响应消息体通常以结构化格式返回，与响应消息头中Conten

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
清理多版本数据 - 数据湖探索 DLI

yyyy-MM-dd HH:mm:ss 注意事项 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。该命令不会删除当前版本数据。示例删除dliTable表在2021-09-25 23:59:59之前生成的多

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
Json函数和运算符 - 数据湖探索 DLI

index) → json 该函数的语义已被破坏。如果提取的元素是字符串，它将被转换为未正确使用引号括起来的无效JSON值（值不会被括在引号中，任何内部引号不会被转义）。建议不要使用该函数。无法在不影响现有用法的情况下修正该函数，可能会在将来的版本中删除该函数。返回指定索引位置的json元素，索引从0开始

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

column 'robot_name' at row 1。原因分析客户的数据中存在emoj表情，这些表情是按照四个字节一个单位进行编码的，而通常使用的utf-8编码在mysql数据库中默认是按照三个字节一个单位进行编码的，这个原因导致将数据存入mysql数据库时出现错误。出现该问题可能原因如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

class-name' = '' ); 参数说明表1 参数说明参数是否必选说明 connector.type 是只能为user-defined，表示使用自定义的source。 connector.class-name 是 source函数的全限定类名。 connector.class-parameter

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

'datagen' ); 参数说明表1 参数说明参数是否必选默认值数据类型参数说明 connector 是无 String 指定要使用的连接器，这里是'datagen'。 rows-per-second 否 10000 Long 每秒生成的行数，用以控制数据发出速率。 fields

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
插入数据至RDS表 - 数据湖探索 DLI

想要插入到表中的值，列与列之间用逗号分隔。注意事项 DLI表必须已经存在。 DLI表在创建时不需要指定Schema信息，Schema信息将使用RDS表的信息。如果select子句中选择的字段数量和类型与RDS表的Schema信息不匹配时，系统将报错。不建议对同一张表并发插入数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
插入数据至DWS表 - 数据湖探索 DLI

想要插入到表中的值，列与列之间用逗号分隔。注意事项 DLI表必须已经存在。 DLI表在创建时不需要指定Schema信息，Schema信息将使用DWS表的信息。如果select子句中选择的字段数量和类型与DWS表的Schema信息不匹配时，系统将报错。不建议对同一张表并发插入数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

的结果，可以通过在聚合函数中使用order by子句来指定此顺序。 array_agg(x ORDER BY y DESC); array_agg(x ORDER BYx,y,z); 过滤filter 使用filter关键字可以在聚合的过程中，通过使用where的条件表达式来过滤

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

据。和其他连续表上的聚合不同，窗口聚合不产生中间结果，只在窗口结束产生一个总的聚合结果，另外，窗口聚合会清除不需要的中间状态。更多介绍和使用请参考开源社区文档：窗口聚合。分组窗口的开始和结束时间戳可以通过 window_start 和 window_end 来选定。窗口表值函数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

配置项 .load("obs://bucket/to_your_table"); // 指定读取的hudi表路径，DLI仅支持使用OBS路径 dataFrame.show(100); // 2. 通过SparkSession 提交 SQL，需要对接元数据服务。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
基本语句 - 数据湖探索 DLI
基本语句 - 数据湖探索 DLI

确写出，如果不指定ALL或DISTINCT，查询结果将包含所有的行，即使是重复的行数据也将被返回。 DISTINCT 在SELECT语句中使用DISTINCT关键字时，系统会在查询结果中去除重复的数据，确保结果的唯一性。 WHERE 指定查询的过滤条件，支持算术运算符、关系运算符和逻辑运算符。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

最新成功的Checkpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

e(fs.special_start_time), 'yyyymmdd') = substr('20220601',1,8) 解决措施在使用join进行多表关联查询时，不管表数据量大小，join时都需要指定on条件来减少多表关联的数据量，从而减轻队列的负荷，提升查询效率。例如

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SUM(amount) FROM Orders GROUP BY GROUPING SETS ((user), (product)); GROUP BY中使用HAVING过滤功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 4 5 SELECT [ ALL | DISTINCT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML

总条数： 1016

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分组聚合 - 数据湖探索 DLI

CLUSTERING - 数据湖探索 DLI

UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

检查SQL语法 - 数据湖探索 DLI

返回结果 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

插入数据至RDS表 - 数据湖探索 DLI

插入数据至DWS表 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

基本语句 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线