搜索_华为云

聚合函数概览 - 数据湖探索 DLI

col, p [, B]) DOUBLE 返回组内数字列近似的第p位百分数（包括浮点数），p值在[0,1]之间。参数B控制近似的精确度，B值越大，近似度越高，默认值为10000。当列中非重复值的数量小于B时，返回精确的百分数。 stddev_pop stddev_pop(col) DOUBLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
Spark作业开发类 - 数据湖探索 DLI

库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark jar 作业一直处于“提交中”？

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
DLI作业开发流程 - 数据湖探索 DLI

详细操作请参考创建并提交SQL作业。适用于数据仓库查询、报表生成、OLAP（在线分析处理）等场景。 Flink作业专为实时数据流处理设计，适用于低时延、需要快速响应的场景。适用于实时监控、在线分析等场景。 Flink OpenSource作业：DLI提供了标准的连接器（co

帮助中心 > 数据湖探索 DLI > 用户指南
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

使用DLI增强型跨源时，弹性资源池/队列的网段与数据源网段不能重合。访问跨源表需要使用已经创建跨源连接的队列。跨源表不支持Preview预览功能。检测连通性要求检测跨源连接的连通性时对IP约束限制如下： IP必须为合法的IP地址，用“.”分隔的4个十进制数，范围是0-255。测试时IP地址后

 帮助中心 > 数据湖探索 DLI > 产品介绍
数据湖探索简介 - 数据湖探索 DLI

SQL作业支持SQL查询功能：可为用户提供标准的SQL语句。具体内容请参考《数据湖探索SQL语法参考》。 Flink作业支持Flink SQL在线分析功能：支持Window、Join等聚合函数，用SQL表达业务逻辑，简便快捷实现业务。具体内容请参考Flink OpenSource SQL语法参考。

帮助中心 > 数据湖探索 DLI > 产品介绍
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

MRS服务Spark组件的是建立在客户的购买MRS服务所分配的虚机上，用户可以根据实际需求调整及优化Spark服务，支持各种接口调用。 MRS的这种模式提供了更高的自由度和定制性，适合有大数据处理经验的用户使用。具体请参考《MapReduce服务开发指南》。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

计费项包括Kafka实例和Kafka的磁盘存储空间。了解Kafka计费说明。 RDS MySQL 数据库 RDS for MySQL提供在线云数据库服务。 RDS对您选择的数据库实例、数据库存储和备份存储（可选）收费。了解RDS计费说明。 DLV DLV适配云上云下多种数据源

 帮助中心 > 数据湖探索 DLI > 最佳实践
Spark SQL常用配置项说明 - 数据湖探索 DLI

该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

通常用于结构化数据的查询和分析。 Flink作业 Flink作业专为实时数据流处理设计，适用于低时延、需要快速响应的场景。适用于实时监控、在线分析等场景。 Flink OpenSource作业：提交作业时可以使用DLI提供的标准的连接器（connectors）和丰富的API，快速与其他数据系统的集成。

帮助中心 > 数据湖探索 DLI > 产品介绍
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

如果为 true，则根据拆分数推断源并行度。如果为 false，则源的并行度由 config 设置。 table.exec.hive.infer-source-parallelism.max 1000 Integer 设置源运算符的最大推断并行度。 Load Partition Splits

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下已在数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下已在数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Hudi常见配置参数 - 数据湖探索 DLI

000000001），在磁盘空间上进行权衡以降低误报率。 0.000000001 hoodie.bloom.index.parallelism 索引查找的并行度，其中涉及Spark Shuffle。默认情况下，根据输入的工作负载特征自动计算的。 0 hoodie.bloom.index.prune

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

1.0 (5 rows) dense_rank()→ bigint 描述：返回值在一组值中的排名。这与rank（）相似，不同的是tie值不会在序列中产生间隙。 ntile(n)→ bigint 描述：用于将分组数据按照顺序切分成n片，返回当前切片值。NTILE不支持ROWS

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
实时任务接入 - 数据湖探索 DLI

'10', //flink写入并行度 'hoodie.datasource.write.keygenerator.type' = 'COMPLEX',

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

配置数据更新间隔。示例该示例展示了一个经典的业务流水线，维度表来自 Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE TABLE if

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

parallelism 否无 int 定义查找连接运算符的自定义并行度。默认情况下，如果未定义此选项，则规划器将通过考虑全局配置（如果定义了选项“lookup.parallelism”）来推导并行度，否则将考虑输入运算符的并行度。 lookup.batch.interval 否 1s Duration

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
提交SQL作业（推荐） - 数据湖探索 DLI

该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

写入到数据库失败后的最大重试次数。 sink.parallelism 否无 Integer 用于定义JDBC sink算子的并行度。默认情况下，并行度是由框架决定，即与上游并行度一致。分区扫描功能介绍为了加速Source任务实例中的数据读取，Flink为JDBC表提供了分区扫描功能。以下参

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DWS源表（不推荐使用） - 数据湖探索 DLI

包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。推荐使用DWS服务自研的DWS Connector。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS

总条数： 85

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

聚合函数概览 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线