搜索_华为云

窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，性能较好。通常，窗口去重直接用于窗口表值函数上。另外，它可以用于基于窗口表值函数的操作。比如窗口聚合，窗口TopN和窗口关联。窗口Top-N的语法和普通的Top-N相同。除此之外，窗口去重需要 PARTITION

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
配置DLI程序包权限 - 数据湖探索 DLI

配置DLI程序包权限针对不同用户，可以通过权限设置分配不同的程序包组或程序包，不同用户之间的作业效率互不影响，保障作业性能。管理员用户、程序包组拥有程序包组的所有权限。不需要进行权限设置，且其他用户无法修改其程序包组权限。管理员用户、程序包的所有者拥有程序包的所有权限。不需

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Flink作业性能调优 - 数据湖探索 DLI

压状态和时延可以通过Flink UI或者作业任务列表查看，一般情况下反压和高时延成对出现：图2 反压状态和时延性能分析由于Flink的反压机制，流作业在存在性能问题的情况下，会导致数据源消费速率跟不上生产速率，从而引起Kafka消费组的积压。在这种情况下，可以通过算子的反压和时延，确定算子的性能瓶颈点。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
使用DataSource语法创建DLI表 - 数据湖探索 DLI

示例说明：创建名为table2的DLI非分区表，您可以根据业务需求自定义列子段的原生数据类型：与文字字符有关可以使用STRING、CHAR或者VARCHAR。与时间有关的可以使用TIMESTAMP、DATE。与整数有关的可以使用INT、SMALLINT/SHORT、BIGINT/LONG、TINYINT。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

FIRST | NEXT } [ count ] { ROW | ROWS } { ONLY | WITH TIES } ] from_item 可以是以下形式： table_name [ [ AS ] alias [ ( column_alias [, ...] ) ] ] from_item

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
使用DataSource语法创建OBS表 - 数据湖探索 DLI

示例说明：创建名为table2的OBS非分区表，您可以根据业务需求自定义列字段的原生数据类型：与文字字符有关可以使用STRING、CHAR或者VARCHAR。与时间有关的可以使用TIMESTAMP、DATE。与整数有关的可以使用INT、SMALLINT/SHORT、BIGINT/LONG、TINYINT。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用Hive语法创建OBS表 - 数据湖探索 DLI

示例说明：创建名为table2的OBS非分区表，您可以根据业务需求自定义列字段的原生数据类型：与文字字符有关可以使用STRING、CHAR或者VARCHAR。与时间有关的可以使用TIMESTAMP、DATE。与整数有关的可以使用INT、SMALLINT/SHORT、BIGINT/LONG、TINYINT。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内置依赖包”），这些常用

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

col_name：新增列名，必须指定。暂不支持给嵌套列添加新的子列 col_type：新增列类型，必须指定。 nullable：新增列是否可以为空，可以缺省。 comment：新增列comment，可以缺省。所需权限 SQL权限表2 ALTER TABLE所需权限列表权限描述表的ALTER权限细粒度权限：dli:table:alter。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Schema演进语法说明
比较函数 - 数据湖探索 DLI
比较函数 - 数据湖探索 DLI

UNKNOWN。如果需要可以定义转义字符。尚不支持转义字符。 value1 IN (value2 [, value3]* ) BOOLEAN 在给定列表 (value2, value3, …) 中存在value1返回TRUE。当列表包含NULL，如果可以找到value1则返回TRUE，否则返回UNKNOWN。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

如果API调用超过该时间限制则会超时报错。解决方案调用“提交SQL作业”API时可以通过设置“dli.sql.sqlasync.enabled”参数为“true”来异步运行该作业。具体可以参考提交SQL作业API。父主题： DLI API类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

like.element.col2。 col_type：新增列类型，必须指定。 nullable：新增列是否可以为空，可以缺省。 comment：新增列comment，可以缺省。 col_position：列添加位置包括FIRST、AFTER origin_col两种，指定FIR

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
标示符 - 数据湖探索 DLI
标示符 - 数据湖探索 DLI

output_format_classname partition_col_name partition_col_value partition_specs property_name property_value regex_expression result_expression row_format

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Hudi数据表Compaction规范 - 数据湖探索 DLI

不需要对每张Hudi表都开发异步Compaction任务，这样会导致作业开发成本上升。异步Compaction任务可以通过提交Spark SQL作业来完成，也可以在Spark jar任务中处理多张表的compaction，clean，archive： hoodie.clean.async

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Hudi数据表Archive规范 - 数据湖探索 DLI

Archive作业每天至少执行一次，可以2~4小时执行一次。 Hudi的MOR表和COW表都需要保证每天至少1次Archive，MOR表的Archive可以参考2.2.1.6小节和Compaction放在一起异步去执行。COW的Archive可以在写数据时自动判断是否执行。父主题：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
sum - 数据湖探索 DLI
sum - 数据湖探索 DLI

sum(DISTINCT col) 参数说明表1 参数说明参数是否必选说明 col 是列值支持所有数据类型，可以转换为DOUBLE类型后参与运算。列值可以为DOUBLE、DECIMAL或BIGINT类型。如果输入为STRING类型，会隐式转换为DOUBLE类型后参与运算。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
更新表分区信息（只支持OBS表） - 数据湖探索 DLI

SERDEPROPERTIES：Serde属性。参数说明表1 参数描述参数描述 table_name 表名称。 partition_specs 分区字段。 obs_path OBS存储路径。注意事项该命令的主要应用场景是针对分区表，如当手动在OBS上面添加分区目录时，再通过上

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
CREATE VIEW - 数据湖探索 DLI
CREATE VIEW - 数据湖探索 DLI

述。在HetuEngine中创建的视图，视图的定义以编码方式存储在数据源里。在数据源可以查询到该视图，但无法对该视图执行操作。视图是只读的，不可对它执行LOAD、INSERT操作。视图可以包含ORDER BY和LIMIT子句，如果关联了该视图的查询语句也包含了这些子句，那么查询语句中的ORDER

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

在其中执行删除操作的Hudi表的名称。 tablelocation Hudi表的存储路径 instant-time 执行show compaction命令可以看到instant-time 示例 schedule compaction on h1; show compaction on h1; run

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
JSON函数 - 数据湖探索 DLI
JSON函数 - 数据湖探索 DLI

回。默认情况下，该值以STRING类型返回。使用returnType可以选择不同的类型，支持以下类型： VARCHAR / STRING BOOLEAN INTEGER DOUBLE 对于空路径表达式或错误，可以定义为返回null、报错或返回定义的默认值。省略时，默认值为NULL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数

总条数： 786

上一页
1
...
33
34
35
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

窗口去重 - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

比较函数 - 数据湖探索 DLI

创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

标示符 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

sum - 数据湖探索 DLI

更新表分区信息（只支持OBS表） - 数据湖探索 DLI

CREATE VIEW - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

JSON函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线