搜索_华为云

成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

云容器引擎-成长地图 | 华为云数据湖探索数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、HetuEngine生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。

帮助中心 > 数据湖探索 DLI > 成长地图
使用HetuEngine on Hudi - 数据湖探索 DLI

使用HetuEngine on Hudi HetuEngine是高性能的交互式SQL分析及数据虚拟化引擎，它与大数据生态无缝融合，实现海量数据秒级交互式查询，并支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
BI工具连接DLI方案概述 - 数据湖探索 DLI

DLI服务通过对数据的融合分析处理，可以为BI工具提供标准的、有效的高质量数据，供给后续的数据统计分析使用。通过连接到DLI，BI工具可以更加灵活的使用DLI访问和分析数据，帮助企业快速做出基于数据的决策。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、trino生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
数据湖探索简介 - 数据湖探索 DLI

数据湖探索简介什么是数据湖探索数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、HetuEngine生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。

帮助中心 > 数据湖探索 DLI > 产品介绍
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

采用批流融合高扩展性框架，为TB~EB级数据提供了更实时高效的多样性算力，可支撑更丰富的大数据处理需求。产品内核及架构深度优化，综合性能是传统MapReduce模型的百倍以上，SLA保障99.95%可用性。

帮助中心 > 数据湖探索 DLI > 产品介绍
聚合函数概览 - 数据湖探索 DLI

聚合函数概览 DLI所支持的聚合函数如聚合函数表所示。表1 聚合函数表函数命令格式返回值功能简介 avg avg(col), avg(DISTINCT col) DOUBLE 求平均值。 corr corr(col1, col2) DOUBLE 返回两列数值的相关系数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
T-Digest函数 - 数据湖探索 DLI
T-Digest函数 - 数据湖探索 DLI

T-Digest函数概述 T-digest是存储近似百分位信息的数据草图。HetuEngine中用tdigest表示这种数据结构。T-digest可以合并，在存储时可以强转为VARBINARY，检索时再由VARBINARY转换为T-digest 函数 merge(tdigest)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

跨源连接 DLI自定义委托自定义镜像 OBS 2.0支持数据湖探索数据湖探索（Data Lake Insight，以下简称DLI）是完全兼容Apache Spark、Apache Flink、HetuEngine生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务

 帮助中心 > 数据湖探索 DLI > 功能总览
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

聚合函数聚合函数对一组值进行运算，最终获得一个单值。除count()、count_if()、max_by()、min_by()和approx_distinct()外，其它聚合函数都忽略空值，并在没有输入行或所有值都为空时返回空值。例如sum()返回null而不是零，并且avg(

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

HetuEngine简介 HetuEngine是华为推出的高性能交互式SQL分析及数据虚拟化引擎，能够与大数据生态无缝融合，实现海量数据的秒级交互式查询。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
Quantile digest函数 - 数据湖探索 DLI

Quantile digest函数概述 Quantile digest（分位数摘要）是存储近似百分位信息的数据草图。HetuEngine中用qdigest表示这种数据结构。函数 merge(qdigest) → qdigest 描述：将所有输入的qdigest数据合并成一个qdigest

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析程序。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 DLI提供了Spark和Flink计算引擎，为用户提供了一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务，当前，Flink计算引擎推荐版本：Flink 1.15，Spark计算引擎推荐版本： Spark 3.3.1。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentlie_approx percentile_approx函数用于计算近似百分位数，适用于大数据量。先对指定列升序排列，然后取第p位百分数最靠近的值。命令格式 percentile_approx (colname,DOUBLE p) 参数说明表1 参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentlie percentile函数用于计算精确百分位数，适用于小数据量。先对指定列升序排列，然后取第p位百分数的精确值。命令格式 percentile(colname,DOUBLE p) 参数说明表1 参数说明参数是否必选参数类型说明 colname 是 STRING

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

TABLESAMPLE 有BERNOULLI和SYSTEM两种采样方法。这两种采样方法都不允许限制结果集返回的行数。 BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行时计算的随机值之间的比较

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
percentile - 数据湖探索 DLI
percentile - 数据湖探索 DLI

percentile percentlie函数用于返回数值区域的百分比数值点。命令格式 percentile(BIGINT col, p) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。 p 是 0<=P<=1,否则返回NULL

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
percentile - 数据湖探索 DLI
percentile - 数据湖探索 DLI

percentile_approx percentile_approx函数用于返回组内数字列近似的第p位百分数（包括浮点数）。命令格式 percentile_approx(DOUBLE col, p [, B]) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
DLI作业开发流程 - 数据湖探索 DLI

使用DLI提交作业 DLI提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务，支持多种作业类型以满足不同的数据处理需求。表1 DLI支持的作业类型作业类型说明适用场景 SQL作业适用于使用标准SQL语句进行查询的场景。

帮助中心 > 数据湖探索 DLI > 用户指南

总条数： 24

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

成长地图 - 数据湖探索 DLI

使用HetuEngine on Hudi - 数据湖探索 DLI

BI工具连接DLI方案概述 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

聚合函数概览 - 数据湖探索 DLI

T-Digest函数 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

Quantile digest函数 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

percentile - 数据湖探索 DLI

percentile - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线