搜索_华为云

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Livy是基于开源的Apache Livy用于提交Spark作业到DLI的客户端工具。准备工作创建DLI队列。在“队列类型”中选择“通用队列”，即Spark作业的计算资源。具体请参考创建队列。准备一个linux弹性云服务器ECS，用于安装DLI Livy。 ECS需要放通30000至32767端口、8

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

1时，支持在Spark参数（--conf)配置计算资源规格参数，且conf的配置优先级高于高级配置指定的值。参数对应关系请参考表4。在Spark参数（--conf)配置计算资源规格参数时，可以配置单位 M/G/K，不配置时候默认单位为byte。 Spark3.3.1及以上版本增加了对作业的计算资源规格的约束限制。详细信息请参考表8。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
在DLI控制台创建数据库和表 - 数据湖探索 DLI

目。企业项目是一种云资源管理方式，企业项目管理服务提供统一的云资源按项目管理，以及项目内的资源管理、成员管理。关于如何设置企业项目请参考《企业管理用户指南》。说明：只有开通了企业管理服务的用户才显示该参数。描述该数据库的描述。标签使用标签标识云资源。包括标签键和标

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
数据湖探索简介 - 数据湖探索 DLI

内容请参考Flink OpenSource SQL语法参考。 Spark作业提供全托管式Spark计算特性：用户可通过交互式会话(session)和批处理(batch)方式提交计算任务，在全托管Spark队列上进行数据分析。具体内容请参考《数据湖探索API参考》。多数据源分析：

帮助中心 > 数据湖探索 DLI > 产品介绍
instr1 - 数据湖探索 DLI
instr1 - 数据湖探索 DLI

instr1 instr1函数用于计算子串str2在字符串str1中的位置。相似函数：instr，instr函数用于返回substr在str中最早出现的下标。但是instr不支持指定起始搜索位置和匹配次数。命令格式 instr1(string <str1>, string <str2>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
instr - 数据湖探索 DLI
instr - 数据湖探索 DLI

当参数中出现NULL时，返回NULL，当str中不存在substr时返回0，注意下标从1开始。相似函数：instr1，instr1函数用于计算子串str2在字符串str1中的位置，instr1函数支持指定起始搜索位置和匹配次数。命令格式 instr(string <str>, string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentlie percentile函数用于计算精确百分位数，适用于小数据量。先对指定列升序排列，然后取第p位百分数的精确值。命令格式 percentile(colname,DOUBLE p) 参数说明表1 参数说明参数是否必选参数类型说明 colname 是 STRING类型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
row - 数据湖探索 DLI
row - 数据湖探索 DLI

row_number row_number函数用于计算行号。从1开始递增。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。命令格式 row_number() ove

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
Flink作业性能调优 - 数据湖探索 DLI

使用超高IO本地盘规格机型，加速磁盘操作 group agg单点及数据倾斜调优按天聚合计算或者group by key不均衡场景下，group聚合计算存在单点或者数据倾斜问题，此时，可以通过将聚合计算拆分成Local-Global进行优化。配置方式为设置调优参数: table.optimizer

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

查看队列的的剩余步骤如下：查看队列CU使用量。点击“云监控服务 > 云服务监控 > 数据探索湖 > 队列监控 > 队列CU使用量” 。计算剩余CU量。队列剩余CU量=队列CU量 - 队列CU使用量。当队列剩余CU量小于用户提交的CU量，则需要等待资源，才能提交成功。父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
DLI对接LakeFormation - 数据湖探索 DLI

DLI对接LakeFormation 操作场景 LakeFormation是企业级一站式湖仓构建服务，提供元数据统一管理能力，支持无缝对接多种计算引擎及大数据云服务，便捷高效地构建数据湖和运营相关业务，加速释放业务数据价值。在DLI的Spark作业和SQL作业场景，支持对接Lake

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 // 每天计算SUM（金额）（事件时间）。 insert into temp SELECT name, TUMBLE_START(ts, INTERVAL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentlie_approx percentile_approx函数用于计算近似百分位数，适用于大数据量。先对指定列升序排列，然后取第p位百分数最靠近的值。命令格式 percentile_approx (colname,DOUBLE p) 参数说明表1 参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

数据湖探索（DLI）提供了丰富的字符串函数，用于处理和转换字符串数据。这些函数包括拼接、大小写转换、截取子串、替换、正则匹配、编码解码、格式转换等。此外，还支持字符串长度计算、位置查找、填充、反转等功能，以及从JSON字符串中提取值的JSON_VAL函数。这些功能广泛应用于数据清洗、文本处理和数据分析场景，为开发者提供强大的工具支持。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
数学运算函数 - 数据湖探索 DLI

所有数字类型计算给定A的正弦值。 COS(A) 所有数字类型计算给定A的余弦值。 TAN(A) 所有数字类型计算给定A的正切值。 COT(A) 所有数字类型计算给定A的余切值。 ASIN(A) 所有数字类型计算给定A的反正弦值。 ACOS(A) 所有数字类型计算给定A的反余弦值。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

CORRECTED: Spark 不会进行重新调整，而是按照原样读取日期/时间戳。 LEGACY: Spark 会将日期/时间戳从传统的混合模式（儒略历 + 格里历）日历重新调整到外推格里历。该配置项仅在 Parquet 文件的写入信息（如 Spark、Hive）未知时才生效。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
分析窗口函数概览 - 数据湖探索 DLI

DOUBLE 为窗口的ORDER BY子句所指定列中值的返回秩，但以介于0和1之间的小数形式表示，计算方法为 (RANK - 1)/(- 1)。 rank rank() INT 计算一个值在一组值中的排位。如果出现并列的情况，RANK函数会在排名序列中留出空位。 row_number

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

如购买按需计费的队列，在使用队列资源时，按照队列CU时进行计费。以小时为单位进行结算。不足一小时按一小时计费，小时数按整点计算。队列CU时按需计费的计算费用=单价*CU数*小时数。步骤1：创建并上传数据创建CSV数据，例如，如图2所示test.csv：图2 创建test.csv文件

 帮助中心 > 数据湖探索 DLI > 最佳实践
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

数据湖探索（DLI）提供了丰富的字符串函数，用于处理和转换字符串数据。这些函数包括拼接、大小写转换、截取子串、替换、正则匹配、编码解码、格式转换等。此外，还支持字符串长度计算、位置查找、填充、反转等功能，以及从JSON字符串中提取值的JSON_VAL函数。这些功能广泛应用于数据清洗、文本处理和数据分析场景，为开发者提供强大的工具支持。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数

总条数： 610

上一页
1
...
6
7
8
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

Hudi - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

instr1 - 数据湖探索 DLI

instr - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

row - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

分析窗口函数概览 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线