搜索_华为云

Hudi Clustering操作说明 - 数据湖探索 DLI

Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hudi表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
FileSystem结果表 - 数据湖探索 DLI

时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Flink作业模板相关 - 数据湖探索 DLI

已参考初始化DLI客户端完成客户端DLIClient的初始化。新建作业模板 DLI提供新建Flink作业模板的接口。您可以使用该接口新建一个Flink作业模板。示例代码如下： 1 2 3 4 5 6 public static void createFlinkJobTemplate(DLIClient

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
对象存储OBS结果表 - 数据湖探索 DLI

时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

返回表达式不为NULL的输入行数。对每个值的一个唯一实例使用DISTINCT。 COUNT(*) COUNT(1) BIGINT 返回元组个数 AVG([ ALL | DISTINCT ] expression) DOUBLE 返回所有值的平均值。对每个值的一个唯一实例使用DISTINCT。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

返回表达式不为NULL的输入行数。对每个值的一个唯一实例使用DISTINCT。 COUNT(*) COUNT(1) BIGINT 返回元组个数 AVG([ ALL | DISTINCT ] expression) DOUBLE 返回所有值的平均值。对每个值的一个唯一实例使用DISTINCT。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

名称：添加的队列的名称。类型：根据作业需要选择队列类型。本示例选择为：通用队列。 SQL队列类型：用于运行Spark SQL和HetuEngine作业。通用队列类型：用于运行Flink和Spark Jar作业。其他参数请根据需要配置。图3 添加队列配置完基本参数后，单击“下一步”，在队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Hudi表使用约束 - 数据湖探索 DLI

优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。 Merge On Read 读时合并表也简称MOR表，使用列格式parquet和行格式Avro两

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

依次为每一行分配一个唯一且连续的号码。目前，我们只支持 ROW_NUMBER 在 over 窗口函数中使用。未来将会支持 RANK() 和 DENSE_RANK()函数。 PARTITION BY col1[, col2...]: 指定分区列，每个分区都将会有一个 Top-N 结果。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
concat - 数据湖探索 DLI
concat - 数据湖探索 DLI

输入为ARRAY数组：将多个ARRAY数组中的所有元素连接在一起，生成一个新的ARRAY数组。 concat(array<T> <a>, array<T> <b>[,...]) 输入为字符串：将多个字符串连接在一起，生成一个新的字符串。 concat(string <str1>, string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

依次为每一行分配一个唯一且连续的号码。目前，我们只支持 ROW_NUMBER 在 over 窗口函数中使用。未来将会支持 RANK() 和 DENSE_RANK()函数。 PARTITION BY col1[, col2...]: 指定分区列，每个分区都将会有一个 Top-N 结果。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
创建Hive Catalog - 数据湖探索 DLI

其他外部系统中存储的函数和信息。数据处理最关键的方面之一是管理元数据。元数据可以是临时的，例如临时表、或者通过TableEnvironment注册的UDF。元数据也可以是持久化的，例如Hive Metastore中的元数据。Catalog 提供了一个统一的API，用于管理元数据，并使其可以从Table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

time)的比较表达式。注意事项时间窗口join需要至少一个 equi-join 谓词和一个限制了双方时间的 join 条件。例如使用两个适当的范围谓词（<, <=, >=, >），一个 BETWEEN 谓词或一个比较两个输入表中相同类型的时间属性（即处理时间和事件时间）的相等谓词比如，以下谓词是合法的窗口

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
decode1 - 数据湖探索 DLI
decode1 - 数据湖探索 DLI

result 是所有数据类型。 search和expression的值匹配时的返回值。 default 否与result一致。如果所有的搜索项都不匹配，则返回default值，如果未指定，则返回NULL。返回值说明 result 和 default 为返回值，支持返回所有的数据类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

Council) 组织制定的用来模拟决策支持类应用的一个测试集。目前，在学术界和工业界普遍用来评价决策支持技术方面应用的性能。这种商业测试可以全方位评测系统的整体商业计算综合能力，对厂商的要求更高，同时也具有普遍的商业实用意义，目前在银行信贷分析和信用卡分析、电信运营分析、税收分析、烟草行业决策分析中都有广泛的应用。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

time)的比较表达式。注意事项时间窗口join需要至少一个 equi-join 谓词和一个限制了双方时间的 join 条件。例如使用两个适当的范围谓词（<, <=, >=, >），一个 BETWEEN 谓词或一个比较两个输入表中相同类型的时间属性（即处理时间和事件时间）的相等谓词比如，以下谓词是合法的窗口

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

time)的比较表达式。注意事项时间窗口join需要至少一个 equi-join 谓词和一个限制了双方时间的 join 条件。例如使用两个适当的范围谓词（<, <=, >=, >），一个 BETWEEN 谓词或一个比较两个输入表中相同类型的时间属性（即处理时间和事件时间）的相等谓词比如，以下谓词是合法的窗口

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
集合操作 - 数据湖探索 DLI
集合操作 - 数据湖探索 DLI

Except返回多个查询结果的差集。注意事项集合运算是以一定条件将表首尾相接，所以其中每一个SELECT语句返回的列数必须相同，列的类型一定要相同，列名不一定要相同。 UNION默认是去重的，UNION ALL是不去重的。示例输出Orders1和Orders2的并集，不包含重复记录。 1 2 insert

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
集合操作 - 数据湖探索 DLI
集合操作 - 数据湖探索 DLI

Except返回多个查询结果的差集。注意事项集合运算是以一定条件将表首尾相接，所以其中每一个SELECT语句返回的列数必须相同，列的类型一定要相同，列名不一定要相同。 UNION默认是去重的，UNION ALL是不去重的。示例输出Orders1和Orders2的并集，不包含重复记录。 1 2 insert

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
创建弹性资源池并添加队列 - 数据湖探索 DLI

性资源池并添加队列的操作步骤。 DLI弹性资源池之间为物理集群隔离，同一个弹性资源池中的队列之间为逻辑隔离。建议您对测试业务场景和生产业务场景分别创建弹性资源池，通过资源物理隔离的方式，保障资源管理的独立性和安全性。弹性资源池约束与限制表1 弹性资源池约束限制限制项说明

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列

总条数： 636

上一页
1
...
6
7
8
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Clustering操作说明 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

Flink作业模板相关 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

concat - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

decode1 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

集合操作 - 数据湖探索 DLI

集合操作 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线