搜索_华为云

去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

）则只保留最后一行。 WHERE rownum = 1: Flink 需要 rownum = 1 以确定该查询是否为去重查询。注意事项无示例根据order_id对数据进行去重，其中proctime为事件时间属性列 SELECT order_id, user, product, number

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

）则只保留最后一行。 WHERE rownum = 1: Flink 需要 rownum = 1 以确定该查询是否为去重查询。注意事项无示例根据order_id对数据进行去重，其中proctime为事件时间属性列 SELECT order_id, user, product, number

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

）则只保留最后一行。 WHERE rownum = 1: Flink 需要 rownum = 1 以确定该查询是否为去重查询。注意事项无示例根据order_id对数据进行去重，其中proctime为事件时间属性列 SELECT order_id, user, product, number

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。用户使用自定义镜像功能需要具备Docker相关的基础知识。使用限制

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

恢复什么是从checkpoint恢复？ Flink Checkpoint 是一种容错恢复机制。这种机制保证了实时程序运行时，遇到异常或者机器问题时能够进行自我恢复。从checkpoint恢复的原则通常当作业执行失败、资源异常重启等非人为触发的异常场景时，支持从checkpoint恢复。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
聚合函数概览 - 数据湖探索 DLI

col2) DOUBLE 返回两列数值协方差。 covar_samp covar_samp(col1, col2) DOUBLE 返回两列数值样本协方差。 max max(col) DOUBLE 返回最大值。 min min(col) DOUBLE 返回最小值。 percentile

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
stddev - 数据湖探索 DLI
stddev - 数据湖探索 DLI

stddev_samp函数用于返回指定列的样本偏差。命令格式 stddev_samp(col) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的样本偏差。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

操作场景 DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。本例介

 帮助中心 > 数据湖探索 DLI > 快速入门
covar - 数据湖探索 DLI
covar - 数据湖探索 DLI

covar_samp covar_samp函数用于返回两列数值样本协方差。命令格式 covar_samp(col1, col2) 参数说明表1 参数说明参数是否必选说明 col1 是数据类型为数值的列。其他类型返回NULL。 col2 是数据类型为数值的列。其他类型返回NULL。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
var - 数据湖探索 DLI
var - 数据湖探索 DLI

var_samp函数用于返回指定列的样本方差。命令格式 var_samp(col) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的样本方差。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

ALL，返回所有输入行中表达式的样本标准偏差。使用 DISTINCT 则对所有值去重后计算。 VAR_POP([ ALL | DISTINCT ] expression) 默认情况下或使用关键字 ALL，返回所有输入行中表达式的总体方差（总体标准差的平方）。使用 DISTINCT 则对所有值去重后计算。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

返回所有输入值之间的数字字段的样本方差 COLLECT([ ALL | DISTINCT ] expression) MULTISET 返回所有输入值的MULTISET VARIANCE([ ALL | DISTINCT ] expression) DOUBLE 返回所有输入值之间的数字字段的样本方差

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

返回所有输入值之间的数字字段的样本方差 COLLECT([ ALL | DISTINCT ] expression) MULTISET 返回所有输入值的MULTISET VARIANCE([ ALL | DISTINCT ] expression) DOUBLE 返回所有输入值之间的数字字段的样本方差

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

k的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
DLI作业开发流程 - 数据湖探索 DLI

了资源管理和作业调度。支持多种数据源和格式，提供了丰富的数据处理能力，包括但不限于SQL查询、机器学习等。详细操作请参考创建Spark作业。适用于大规模数据处理和分析，如机器学习训练、日志分析、大规模数据挖掘等场景。管理Jar作业的程序包 DLI允许用户提交编译为Jar包的

 帮助中心 > 数据湖探索 DLI > 用户指南
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

DLI元数据是SQL作业开发的基础。在执行作业前您需要根据业务场景定义数据库和表。步骤4：创建表数据库创建完成后，需要在数据库db1中基于OBS上的样本数据创建表。步骤5：查询数据使用标准SQL语句进行数据的查询和分析。准备工作已注册华为账号并开通华为云，且在使用DLI前检查账号状态，账号不能处于欠费或冻结状态。

帮助中心 > 数据湖探索 DLI > 快速入门
UNION - 数据湖探索 DLI
UNION - 数据湖探索 DLI

UNION：集合运算，以一定条件将表首尾相接，其中每一个SELECT语句返回的列数必须相同，列的类型和列名不一定要相同。注意事项 UNION默认是去重的，UNION ALL是不去重的。不能在多个集合运算间（UNION，INTERSECT，EXCEPT）加括号，否则会出错。示例返回“SELECT *

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 集合运算SELECT
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

Kubernetes系列课程，带你走进云原生技术的核心 GO语言深入之道介绍几个Go语言及相关开源框架的插件机制跟唐老师学习云网络唐老师将自己对网络的理解分享给大家智能客服您好！我是有问必答知识渊博的的智能问答机器人，有问题欢迎随时求助哦！社区求助华为云社区是华为云用户的聚集地。这里有来自数据湖探索的技术牛人，为您解决技术难题。

帮助中心 > 数据湖探索 DLI > 成长地图
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

业相关组件都运行在容器中，通过下载DLI提供的自定义镜像，可以改变Spark作业和Flink作业的容器运行环境。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式方便地帮助用户进行功能扩展。发布区域：全部创建自定义镜像

 帮助中心 > 数据湖探索 DLI > 功能总览

总条数： 73

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

去重 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

聚合函数概览 - 数据湖探索 DLI

stddev - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

covar - 数据湖探索 DLI

var - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

UNION - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线