搜索_华为云

percentile - 数据湖探索 DLI
percentile - 数据湖探索 DLI

_c0 | +------------+ | 521 | +------------+ 与group by配合使用，对所有商品按照仓库（warehourseId）进行分组，并计算同组商品库存（items）的 0.5 百分位，精确度100。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

窗口不会产生状态过大的问题。可以提供一个合适的状态 time-to-live (TTL) 配置来防止状态过大。注意：这可能会影响查询结果的正确性。更多介绍和使用请参考开源社区文档：分组聚合。 DISTINCT 聚合 DISTINCT 聚合在聚合函数前去掉重复的数据。下面的示例计算 Orders 表中不同

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
返回结果 - 数据湖探索 DLI
返回结果 - 数据湖探索 DLI

对于获取用户Token接口，接口，返回如图1所示的消息头，其中“x-subject-token”就是需要获取的用户Token。有了Token之后，您就可以使用Token认证调用其他API。图1 获取用户Token响应消息头响应消息体响应消息体通常以结构化格式返回，与响应消息头中Conten

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
清理多版本数据 - 数据湖探索 DLI

yyyy-MM-dd HH:mm:ss 注意事项 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。该命令不会删除当前版本数据。示例删除dliTable表在2021-09-25 23:59:59之前生成的多

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
CLUSTERING - 数据湖探索 DLI
CLUSTERING - 数据湖探索 DLI

'2021-08-28'", order => 'id'); 注意事项 table与path参数必须存在一个，否则无法判断需要执行clustering的表。使用由DLI提供的元数据服务时，本命令仅支持配置table参数，不支持配置path参数。如果需要对指定分区进行clustering，参考格式：predicate

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

(VALUES 13, 42) EXCEPT SELECT 13; _col0 ------- 42 (1 row) Having子句目前不支持使用列的别名，例如： select count(userid) as num ,dept as aaa from salary group by

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

改，不支持从checkpoint恢复。应用场景本文列举了一些常见的从checkpoint恢复的场景供您参考，如表1所示。更多场景可以使用从checkpoint恢复的原则结合实际情况进行判断。表1 从checkpoint恢复的常见场景场景是否支持恢复说明调整或者增加并行数

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
触发Flink作业保存点 - 数据湖探索 DLI

String 操作类型。枚举值： TRIGGER：触发 savepoint_path 是 String Savepoint路径。请确保在使用前完成桶的相关操作授权。配置示例：obs://bucket-name/dir/savepoint/ 响应参数状态码： 200 表3 响应Body参数

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业管理相关API
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

class-name' = '' ); 参数说明表1 参数说明参数是否必选说明 connector.type 是只能为user-defined，表示使用自定义的source。 connector.class-name 是 source函数的全限定类名。 connector.class-parameter

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Json函数和运算符 - 数据湖探索 DLI

index) → json 该函数的语义已被破坏。如果提取的元素是字符串，它将被转换为未正确使用引号括起来的无效JSON值（值不会被括在引号中，任何内部引号不会被转义）。建议不要使用该函数。无法在不影响现有用法的情况下修正该函数，可能会在将来的版本中删除该函数。返回指定索引位置的json元素，索引从0开始

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

据。和其他连续表上的聚合不同，窗口聚合不产生中间结果，只在窗口结束产生一个总的聚合结果，另外，窗口聚合会清除不需要的中间状态。更多介绍和使用请参考开源社区文档：窗口聚合。分组窗口的开始和结束时间戳可以通过 window_start 和 window_end 来选定。窗口表值函数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

配置项 .load("obs://bucket/to_your_table"); // 指定读取的hudi表路径，DLI仅支持使用OBS路径 dataFrame.show(100); // 2. 通过SparkSession 提交 SQL，需要对接元数据服务。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
基本语句 - 数据湖探索 DLI
基本语句 - 数据湖探索 DLI

确写出，如果不指定ALL或DISTINCT，查询结果将包含所有的行，即使是重复的行数据也将被返回。 DISTINCT 在SELECT语句中使用DISTINCT关键字时，系统会在查询结果中去除重复的数据，确保结果的唯一性。 WHERE 指定查询的过滤条件，支持算术运算符、关系运算符和逻辑运算符。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

最新成功的Checkpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

e(fs.special_start_time), 'yyyymmdd') = substr('20220601',1,8) 解决措施在使用join进行多表关联查询时，不管表数据量大小，join时都需要指定on条件来减少多表关联的数据量，从而减轻队列的负荷，提升查询效率。例如

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
parse - 数据湖探索 DLI
parse - 数据湖探索 DLI

com/path1/p.php?k1=v1&k2=v2#Ref1', 'HOST') 返回 'facebook.com'.。当第二个参数为QUERY时，可以使用第三个参数提取特定参数的值，例如： parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1'

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SUM(amount) FROM Orders GROUP BY GROUPING SETS ((user), (product)); GROUP BY中使用HAVING过滤功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 4 5 SELECT [ ALL | DISTINCT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SUM(amount) FROM Orders GROUP BY GROUPING SETS ((user), (product)); GROUP BY中使用HAVING过滤功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 4 5 SELECT [ ALL | DISTINCT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SUM(amount) FROM Orders GROUP BY GROUPING SETS ((user), (product)); GROUP BY中使用HAVING过滤功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 4 5 SELECT [ ALL | DISTINCT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

学习的算法库（具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内置依赖包”），这些常用算法库满足了大部分用户的使用场景。对于用户的PySpark程序依赖了内置算法库未提供的程序库该如何呢？其实PySpark本身就已经考虑到这一点了，那就是基于PyFiles来指定依赖，在DLI

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 1040

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

percentile - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

返回结果 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

CLUSTERING - 数据湖探索 DLI

UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

触发Flink作业保存点 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

基本语句 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

parse - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线