搜索_华为云

集合操作 - 数据湖探索 DLI
集合操作 - 数据湖探索 DLI

集合运算是以一定条件将表首尾相接，所以其中每一个SELECT语句返回的列数必须相同，列的类型一定要相同，列名不一定要相同。 UNION默认是去重的，UNION ALL是不去重的。示例输出Orders1和Orders2的并集，不包含重复记录。 1 2 insert into temp SELECT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
集合操作 - 数据湖探索 DLI
集合操作 - 数据湖探索 DLI

集合运算是以一定条件将表首尾相接，所以其中每一个SELECT语句返回的列数必须相同，列的类型一定要相同，列名不一定要相同。 UNION默认是去重的，UNION ALL是不去重的。示例输出Orders1和Orders2的并集，不包含重复记录。 1 2 insert into temp SELECT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
集合操作 - 数据湖探索 DLI
集合操作 - 数据湖探索 DLI

集合运算是以一定条件将表首尾相接，所以其中每一个SELECT语句返回的列数必须相同，列的类型一定要相同，列名不一定要相同。 UNION默认是去重的，UNION ALL是不去重的。示例输出Orders1和Orders2的并集，不包含重复记录。 1 2 insert into temp SELECT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

(1,5),(2,6),(3,7),(4,8)) as t(x,y); --1.25 covar_samp(y, x) 描述：返回输入值的样本协方差。 select covar_samp(y,x) from (values (1,5),(2,6),(3,7),(4,8)) as t(x

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
数学函数和运算符 - 数据湖探索 DLI

teger。统计学函数二项分布的置信区间有多种计算公式，最常见的是["正态区间"]，但是，它只适用于样本较多的情况（np > 5 且 n(1 − p) > 5），对于小样本，它的准确性很差。于是采用威尔逊区间： z —— 正态分布，均值 + z * 标准差置信度。 z = 1

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
INTERSECT - 数据湖探索 DLI
INTERSECT - 数据湖探索 DLI

INTERSECT：返回多个查询结果的交集，且每一个SELECT语句返回的列数必须相同，列的类型和列名不一定要相同。INTERSECT默认去重。注意事项不能在多个集合运算间（UNION，INTERSECT，EXCEPT）加括号，否则会出错示例返回“SELECT * FROM

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 集合运算SELECT
创建并提交SQL作业 - 数据湖探索 DLI

进入“SQL编辑器”页面后，系统会提示“创建DLI临时数据桶”，用于存储使用DLI服务产生的临时数据。在“设置DLI作业桶”对话框中，单击“去设置”。在现实页面上单击DLI作业桶卡片右上角单击编辑符号。在弹出的“设置DLI作业桶”对话框，输入作业桶路径，并单击“确定”。在SQL作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

如果创建队列的用户不是管理员用户，在创建队列后，需要管理员用户赋权后才可使用。关于赋权的具体操作请参考《数据湖探索用户指南》。操作步骤在使用JDBC的机器中安装JDK，JDK版本为1.7或以上版本，并配置环境变量。参考下载并安装JDBC驱动包章节，获取DLI JDBC驱动包“huaweic

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

即开即用，Serverless架构。需要较强的技术能力进行搭建、配置、运维。高可用具有跨AZ容灾能力。无高易用学习成本学习成本低，包含10年、上千个项目经验固化的调优参数。同时提供可视化智能调优界面。学习成本高，需要了解上百个调优参数。支持数据源云上：OBS、RDS、DWS、CSS、MongoDB、Redis。

帮助中心 > 数据湖探索 DLI > 产品介绍
EXCEPT - 数据湖探索 DLI
EXCEPT - 数据湖探索 DLI

select_statement; 关键字 EXCEPT：做集合减法。A EXCEPT B将A中所有和B重合的记录扣除，然后返回去重后的A中剩下的记录，EXCEPT默认不去重。与UNION相同，每一个SELECT语句返回的列数必须相同，列的类型和列名不一定要相同。注意事项不能在多个集合运

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 集合运算SELECT
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

gz”，支持在Linux环境中使用，且依赖JDK 1.8及以上版本。配置DLI Spark-submit 使用spark-submit的机器安装JDK 1.8或以上版本并配置环境变量，当前仅在Linux环境下使用spark-submit工具。下载并解压工具包“dli-clientkit-<version>-bin

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
数据操作语句DML - 数据湖探索 DLI

数据操作语句DML SELECT 集合操作窗口 JOIN OrderBy & Limit Top-N 去重父主题： Flink Opensource SQL1.10语法参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考
数据操作语句DML - 数据湖探索 DLI

数据操作语句DML SELECT 集合操作窗口 JOIN OrderBy & Limit Top-N 去重父主题： Flink Opensource SQL1.12语法参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考
数据操作语句DML - 数据湖探索 DLI

数据操作语句DML SELECT INSERT INTO 集合操作窗口分组聚合 Over聚合 JOIN OrderBy & Limit Top-N 去重父主题： Flink Opensource SQL1.15语法参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
离线Compaction配置 - 数据湖探索 DLI

离线Compaction配置对于MOR表的实时业务，通常设置在写入中同步生成compaction计划，因此需要额外通过DataArts或者脚本调度SparkSQL去执行已经产生的compaction计划。执行参数 set hoodie.compact.inline = true;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Spark SQL常用配置项说明 - 数据湖探索 DLI

当子查询中数据不重复的情况下，执行关联子查询，不需要对子查询的结果去重。当子查询中数据重复的情况下，执行关联子查询，会提示异常，必须对子查询的结果做去重处理，比如max(),min()。该参数设置为false：不管子查询中数据重复与否，执行关联子查询时，都需要对子查询的结果去重，比如max(),min()，否则提示异常。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Hudi Compaction操作说明 - 数据湖探索 DLI

Plan，这个Compaction Plan会记录哪些parquet文件将会与哪些log文件进行合并，但是仅仅是一个Plan，没有去合并。Run过程会将TimeLine里的所有Compaction Plan一个一个去执行，一直到全部都执行完。对于Merge-On-Read表，数据使用列式Parquet文件和行式

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
FROM - 数据湖探索 DLI
FROM - 数据湖探索 DLI

FROM后所跟的子查询结果必须带上前面所取的别名，否则会出错。示例返回选了course_info表中课程的学生姓名，并利用DISTINCT关键字进行去重。 1 2 SELECT DISTINCT name FROM (SELECT name FROM student_info JOIN

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
count - 数据湖探索 DLI
count - 数据湖探索 DLI

city1 6 city2 5 city3 6 示例3：通过distinct去重，计算仓库数量。命令示例如下： select count(distinct warehouseId) from warehouse; 返回结果如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
Spark jar 如何读取上传文件 - 数据湖探索 DLI

get("上传的文件名")。 Driver中的文件路径与Executor中获取的路径位置是不一致的，所以不能将Driver中获取到的路径作为参数传给Executor去执行。 Executor获取文件路径的时候，仍然需要使用SparkFiles.get(“filename”)的方式获取。 SparkFiles

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 73

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

集合操作 - 数据湖探索 DLI

集合操作 - 数据湖探索 DLI

集合操作 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

数学函数和运算符 - 数据湖探索 DLI

INTERSECT - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

EXCEPT - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

数据操作语句DML - 数据湖探索 DLI

数据操作语句DML - 数据湖探索 DLI

数据操作语句DML - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

FROM - 数据湖探索 DLI

count - 数据湖探索 DLI

Spark jar 如何读取上传文件 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线