搜索_华为云

count - 数据湖探索 DLI
count - 数据湖探索 DLI

count([distinct|all] <colname>) 参数说明表1 参数说明参数是否必选说明 distinct或all 否表示在计数时是否去除重复记录，默认为all，即计算全部记录。如果指定distinct，则只计算唯一值数量。 colname 是列值可以为任意类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
CREATE TABLE AS SELECT - 数据湖探索 DLI

TABLE AS SELECT 命令功能 CREATE TABLE As SELECT命令通过指定带有表属性的字段列表来创建Hudi Table。在使用由DLI提供的元数据服务时仅可创建外表，即需要通过LOCATION指定表路径。命令格式 CREATE TABLE [ IF NOT EXISTS]

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Hudi表分区设计规范 - 数据湖探索 DLI

件数量；对于增量不是很大的维度表，也可以采用非分区表。如果维度表的总数据量很大或者增量也很大，可以考虑采用某个业务ID进行分区，在大部分数据处理逻辑中针对大维度表，会有一定的业务条件进行过滤来提升处理性能，这类表要结合一定的业务场景来进行优化，无法从单纯的日期分区进行优化。事实表

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
CREATE TABLE AS SELECT - 数据湖探索 DLI

Database名称，由字母、数字和下划线（_）组成。 table_name Database中的表名，由字母、数字和下划线（_）组成。 bucket_name obs桶名称。 tbl_path Delta表在obs桶中的存储位置。 using 参数delta，定义和创建Delta table table_comment

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
修改普通队列的网段 - 数据湖探索 DLI

修改队列网段步骤目前只支持计费模式为“包年包月”和“按需/专属资源模式”的队列修改网段。在DLI管理控制台左侧，选择“资源管理 > 队列管理”。选择待修改的队列，单击“操作”列“更多”中的“修改网段”。图1 修改网段填写需要的网段后，单击“确定”。队列修改网段成功后，需要

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

te table，则会导致批量数据写成非常大的log文件，对后续compaction形成很大压力需要更多资源才能完成。 Hudi表在Hive元数据中，应该会存在1张内部表（手动创建），2张外部表（写入数据后自动创建）。 2张外部表，表名_ro（用户只读合并后的parquet文件，

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

substr('20220601',1,8) 解决措施在使用join进行多表关联查询时，不管表数据量大小，join时都需要指定on条件来减少多表关联的数据量，从而减轻队列的负荷，提升查询效率。例如，问题现象中的问题语句可以根据业务场景，在join时通过指定on条件来进行优化，这样会极大减少关联查询的结果集，提升查询效率。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。如果在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list] FROM

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。若在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list] FROM

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
first - 数据湖探索 DLI
first - 数据湖探索 DLI

当参数的值为True时，返回窗口中第一条非NULL的值。 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。 frame_clause 否用于确定数据边界。返回值说明参数的数据类型。示例代码

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

写数据至多个Sink表 EXECUTE STATEMENT SET BEGIN ... END; 是写数据至多个Sink表的必填语句，用于定义在同一个作业中执行多个插入数据的操作。写数据至多个Sink表时，EXECUTE STATEMENT SET BEGIN ... END;是必填项。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
last - 数据湖探索 DLI
last - 数据湖探索 DLI

当参数的值为True时，返回窗口中第一条非NULL的值。 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。 frame_clause 否用于确定数据边界。返回值说明参数的数据类型。示例代码

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

groupid 否 BIGINT BIGINT类型常量，必须大于等于0。返回值说明返回STRING类型。如果pattern为空串或pattern中没有分组，返回报错。 groupid非BIGINT类型或小于0时，返回报错。不指定时默认为1，表示返回第一个组。如果groupid等于0，则返回满足整个pattern的子串。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

show(100, false); } } 读优化查询：COW表读优化查询等同于快照查询。 MOR表查询在Spark SQL作业中使用元数据服务，或者配置了HMS同步参数，在创建MOR表后，会额外同步创建：“表名_rt”和“表名_ro”两张表。查询后缀为rt的表等同于实时查询，查

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
row - 数据湖探索 DLI
row - 数据湖探索 DLI

表1 参数说明参数是否必选说明 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回DOUBLE类型的值。 a为NULL，则返回NULL。示例代码为便于

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
Spark 2.4.5版本说明 - 数据湖探索 DLI

支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Lambda 表达式 - 数据湖探索 DLI
Lambda 表达式 - 数据湖探索 DLI

'^(\w)(\w*)(\s+.*)$',x -> upper(x[1]) || x[2] || x[3]); -- Once upon a time ... 在聚合函数中应用Lambda表达式。如使用reduce_agg()计算一个较为复杂的按列求元素和： SELECT reduce_agg(value

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
认证鉴权 - 数据湖探索 DLI
认证鉴权 - 数据湖探索 DLI

Key)加密调用请求。推荐使用AK/SK认证，其安全性比Token认证更高。 Token认证 Token在计算机系统中代表令牌（临时）的意思，拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。 Toke

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

DAY 或 INTERVAL '2-10' YEAR TO MONTH 返回间隔。 CURRENT_DATE DATE 返回本地时区中的当前 SQL 日期。在流模式下为每条记录进行取值。但在批处理模式下，它在查询开始时计算一次，并对每一行使用相同的结果。 CURRENT_TIME TIME

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
数组函数和运算符 - 数据湖探索 DLI

[1, 3, 5, 7, 9, 2, 4] (1 row) array_except(x, y) → array 描述：返回去重后的在x中但不在y中的元素数组。 select array_except(array [1,3,5,7,9],array [1,2,3,4,5]); _col0

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符

总条数： 782

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

count - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

修改普通队列的网段 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

first - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

last - 数据湖探索 DLI

regexp - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

row - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

Lambda 表达式 - 数据湖探索 DLI

认证鉴权 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

数组函数和运算符 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线