搜索_华为云

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代

 帮助中心 > 数据湖探索 DLI > 用户指南
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。用户使用自定义镜像功能需要具备Docker相关的基础知识。使用限制

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

即开即用，Serverless架构。需要较强的技术能力进行搭建、配置、运维。高可用具有跨AZ容灾能力。无高易用学习成本学习成本低，包含10年、上千个项目经验固化的调优参数。同时提供可视化智能调优界面。学习成本高，需要了解上百个调优参数。支持数据源云上：OBS、RDS、DWS、CSS、MongoDB、Redis。

帮助中心 > 数据湖探索 DLI > 产品介绍
var - 数据湖探索 DLI
var - 数据湖探索 DLI

var_samp函数用于返回指定列的样本方差。命令格式 var_samp(col) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的样本方差。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
聚合函数概览 - 数据湖探索 DLI

col2) DOUBLE 返回两列数值协方差。 covar_samp covar_samp(col1, col2) DOUBLE 返回两列数值样本协方差。 max max(col) DOUBLE 返回最大值。 min min(col) DOUBLE 返回最小值。 percentile

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

DLI元数据是SQL作业开发的基础。在执行作业前您需要根据业务场景定义数据库和表。步骤4：创建表数据库创建完成后，需要在数据库db1中基于OBS上的样本数据创建表。步骤5：查询数据使用标准SQL语句进行数据的查询和分析。准备工作已注册华为账号并开通华为云，且在使用DLI前检查账号状态，账号不能处于欠费或冻结状态。

帮助中心 > 数据湖探索 DLI > 快速入门
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

返回所有输入值之间的数字字段的样本方差 COLLECT([ ALL | DISTINCT ] expression) MULTISET 返回所有输入值的MULTISET VARIANCE([ ALL | DISTINCT ] expression) DOUBLE 返回所有输入值之间的数字字段的样本方差

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

返回所有输入值之间的数字字段的样本方差 COLLECT([ ALL | DISTINCT ] expression) MULTISET 返回所有输入值的MULTISET VARIANCE([ ALL | DISTINCT ] expression) DOUBLE 返回所有输入值之间的数字字段的样本方差

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

VAR_SAMP([ ALL | DISTINCT ] expression) 默认情况下或使用关键字 ALL，返回所有输入行中表达式的样本方差（样本标准差的平方）。使用 DISTINCT 则对所有值去重后计算。 COLLECT([ ALL | DISTINCT ] expression)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

操作场景 DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。本例介绍

 帮助中心 > 数据湖探索 DLI > 快速入门
对象存储OBS结果表 - 数据湖探索 DLI

FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
covar - 数据湖探索 DLI
covar - 数据湖探索 DLI

covar_samp covar_samp函数用于返回两列数值样本协方差。命令格式 covar_samp(col1, col2) 参数说明表1 参数说明参数是否必选说明 col1 是数据类型为数值的列。其他类型返回NULL。 col2 是数据类型为数值的列。其他类型返回NULL。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
stddev - 数据湖探索 DLI
stddev - 数据湖探索 DLI

stddev_samp函数用于返回指定列的样本偏差。命令格式 stddev_samp(col) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。返回值说明返回DOUBLE类型的值。示例代码计算所有商品库存（items）的样本偏差。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
FileSytem结果表 - 数据湖探索 DLI

成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。语法格式 1 2 3 4 5 6 7 create table filesystemSink ( attr_name

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DLI作业开发流程 - 数据湖探索 DLI

资源管理和作业调度。支持多种数据源和格式，提供了丰富的数据处理能力，包括但不限于SQL查询、机器学习等。详细操作请参考创建Spark作业。适用于大规模数据处理和分析，如机器学习训练、日志分析、大规模数据挖掘等场景。管理Jar作业的程序包 DLI允许用户提交编译为Jar包的F

帮助中心 > 数据湖探索 DLI > 用户指南
Hudi数据表Compaction规范 - 数据湖探索 DLI

jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计规范以及实际流量的波动结合考虑，建议Compaction作业CPU与内存的比例按照1:4~1:8配置，

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
sign - 数据湖探索 DLI
sign - 数据湖探索 DLI

sign sign函数用于返回a所对应的正负号。命令格式 sign(DOUBLE a) 参数说明表1 参数说明参数是否必选参数类型说明 a 是 DOUBLE、BIGINT、DECIMAL、STRING类型。参数a的格式包括浮点数格式、整数格式、字符串格式。返回值说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
FileSystem结果表 - 数据湖探索 DLI

FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

(1,5),(2,6),(3,7),(4,8)) as t(x,y); --1.25 covar_samp(y, x) 描述：返回输入值的样本协方差。 select covar_samp(y,x) from (values (1,5),(2,6),(3,7),(4,8)) as t(x

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符

总条数： 32

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

var - 数据湖探索 DLI

聚合函数概览 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

covar - 数据湖探索 DLI

stddev - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

sign - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线