搜索_华为云

Hudi数据表Archive规范 - 数据湖探索 DLI

automatic默认为true)。 Archive操作并不是每次写数据时都会触发，至少需要满足以下两个条件： Hudi表满足hoodie.keep.max.commits设置的阈值。如果是Flink写hudi至少提交的checkpoint要超过这个阈值；如果是Spark写hudi，写Hudi的次数要超过这个阈值。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Hive方言 - 数据湖探索 DLI
Hive方言 - 数据湖探索 DLI

Flink目前支持两种SQL 方言: default 和 hive。您需要先切换到Hive 方言，然后才能使用Hive语法编写。下面介绍如何使用SQL设置方言。您可以为执行的每个语句动态切换方言。无需重新启动会话即可使用其他方言。语法格式 SQL 方言可以通过 table.sql-dialect

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
类型转换函数 - 数据湖探索 DLI

返回输入表达式的数据类型的字符串表示形式。默认情况下返回的字符串是一个摘要字符串，可能会为了可读性而省略某些细节。如果 force_serializable 设置为 TRUE，则字符串表示可以保留在目录中的完整数据类型。请注意，特别是匿名的内联数据类型没有可序列化的字符串表示。在这种情况下返回 NULL。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
导出查询结果 - 数据湖探索 DLI

file_format为csv时，options参数可以参考表3。注意事项通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute by rand()”，可以增加处理作业的并发量。例如：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

DISTINCT] query ALL和DISTINCT表示是否返回包含重复的行。ALL返回所有的行；DISTINCT返回只包含唯一的行。如果未设置，默认为DISTINCT。 INTERSECT query INTERSECT [DISTINCT] query INTERSECT仅返回

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

jar包冲突。用户提交的flink jar 与 DLI 集群中的hdfs jar包存在冲突。处理步骤 1. 将用户pom文件中的的hadoop-hdfs设置为： <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>h

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
创建全局变量 - 数据湖探索 DLI

下划线开头，且不能超过128字符。 var_value 是 String 全局变量值。 is_sensitive 否 Boolean 是否设置为敏感变量。默认为“false”。响应消息表3 响应参数说明参数名称是否必选参数类型说明 is_success 否 Boolean

帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
INSERT - 数据湖探索 DLI
INSERT - 数据湖探索 DLI

在列名列表中的每一列，其值会设置为null。如果没有指定列名列表，则query语句产生的列必须与将要插入的列完全匹配。使用insert into时，会往表中追加数据，而使用insert overwrite时，如果表属性“auto.purge”被设置为“true”，直接删除原表数据，再写入新的数据。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DML 语法
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项

 帮助中心 > 数据湖探索 DLI > 最佳实践
算术函数 - 数据湖探索 DLI
算术函数 - 数据湖探索 DLI

2 可以为负数，使值的小数点左边的 integer2 位变为零。此函数也可以传入只有一个 numeric1 参数且不设置 Integer2 以使用。如果未设置 Integer2 则 Integer2 为 0。例如 42.324.truncate(2) 为 42.32，42.324

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
开启或关闭数据多版本 - 数据湖探索 DLI

RESTORE TABLE [db_name.]table_name TO initial layout; 关键字 SET TBLPROPERTIES：设置表属性，开启多版本功能。 UNSET TBLPROPERTIES：取消表属性，关闭多版本功能。参数说明表1 参数描述参数描述 db_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
CREATE VIEW - 数据湖探索 DLI
CREATE VIEW - 数据湖探索 DLI

orderkey, orderstatus, totalprice / 4 AS quarter FROM orders 创建一个视图的同时设置表属性： create or replace view view1 comment 'the first view' TBLPROPER

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

跳转至“Spark作业编辑”页面，可根据需要修改参数，执行作业。查找作业在“Spark作业”页面，选择“状态”或“队列”。系统将根据设置的过滤条件，在作业列表显示符合对应条件的作业。终止作业在“Spark作业”页面，单击对应作业“操作”列中的“更多”>“终止作业”，可停止启动中和运行中的作业。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DLI弹性资源池与队列简介 - 数据湖探索 DLI

图1 DLI计算资源模式弹性资源池模式：计算资源的池化管理模式，提供计算资源的动态扩缩容能力，同一弹性资源池中的队列共享计算资源。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率，应对业务高峰期的资源需求。适用场景：适合业务量有明显波动的场合，如周期性的数据批处理任务或实时数据处理需求。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Flink 1.15版本说明 - 数据湖探索 DLI

将非Connector的Flink依赖项（以flink-开头）和第三方库（如Hadoop、Hive、Hudi、Mysql-cdc）的作用域设置为provided，可以确保这些依赖项不会被包含在Jar作业中，从而实现最小化提交，避免依赖包与flink内核中依赖包冲突：仅Flink

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

开通自动续费”。批量资源开通自动续费：选择需要开通自动续费的资源，单击列表左上角的“更多 > 开通自动续费”。选择续费时长，并根据需要设置自动续费次数，单击“开通”。图3 开通自动续费父主题：续费

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
批量运行作业 - 数据湖探索 DLI

执行请求是否成功。“true”表示请求执行成功。 message 否 String 消息内容。请求示例运行ID为131、130、138、137的作业，且设置作业支持从最近创建的保存点恢复。 { "job_ids": [131,130,138,137], "resume_savepoint":

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Jar作业，您需要在代码中开启Checkpoint，同时如果有自定义的状态需要保存，您还需要实现ListCheckpointed接口，并为每个算子设置唯一ID。然后在作业配置中，勾选“从Checkpoint恢复”，并准确配置Checkpoint路径。图2 开启Checkpoint Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
使用Hive语法创建DLI表 - 数据湖探索 DLI

= true ); 示例6：创建textfile格式的非分区表，并设置ROW FORMAT 示例说明：本例创建名为table4的textfile类型的非分区表，并设置ROW FORMAT相关格式（ROW FORMAT功能只支持textfile类型的表）。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
Spark SQL语法概览 - 数据湖探索 DLI

自定义函数相关语法创建函数删除函数显示函数详情显示所有函数数据多版本相关语法创建OBS表时开启数据多版本修改表时开启或关闭数据多版本设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考

总条数： 510

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Archive规范 - 数据湖探索 DLI

Hive方言 - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

创建全局变量 - 数据湖探索 DLI

INSERT - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

算术函数 - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

CREATE VIEW - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Flink 1.15版本说明 - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

批量运行作业 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

Spark SQL语法概览 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线