搜索_华为云

Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

table，则会导致批量数据写成非常大的log文件，对后续compaction形成很大压力需要更多资源才能完成。 Hudi表在Hive元数据中，应该会存在1张内部表（手动创建），2张外部表（写入数据后自动创建）。 2张外部表，表名_ro（用户只读合并后的parquet文件，即读优化

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi表分区设计规范 - 数据湖探索 DLI

于增量不是很大的维度表，也可以采用非分区表。如果维度表的总数据量很大或者增量也很大，可以考虑采用某个业务ID进行分区，在大部分数据处理逻辑中针对大维度表，会有一定的业务条件进行过滤来提升处理性能，这类表要结合一定的业务场景来进行优化，无法从单纯的日期分区进行优化。事实表读取方式都

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
包年包月弹性资源池设置了定时扩缩容时，怎样计费？ - 数据湖探索 DLI

15:50:04变更弹性资源池规格为128CU。弹性资源池计费详情请参见数据湖探索价格详情。价格仅供参考，实际计算请以数据湖探索价格详情中的价格为准。该示例计费详情如表1所示。表1 包年/包月弹性资源池+扩缩容场景计费示例计费模式计算规则付费周期费用计算包年/包月

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

4 (14 rows) percent_rank()→ double 描述：返回值在一组值中的百分比排名。结果为（r-1）/（n-1），其中r是该行的rank（），n是窗口分区中的总行数。 SELECT dept,userid,sal, PERCENT_RANK() OVER(ORDER

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
SHOW TABLES - 数据湖探索 DLI
SHOW TABLES - 数据湖探索 DLI

------------- show_table1 show_table2 (2 rows) --同时满足多个条件，查询default中'show_'开头或者'in'开头的表 show tables in default like 'show$_%|in%' ESCAPE '$';

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

db_name Database名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。 table_name 表名称。Database中的表名，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。匹配规则为：^(?!_)(?![0-9]+$)[A-Za-z0-9

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
显示所有函数 - 数据湖探索 DLI

注意事项显示与给定正则表达式或函数名匹配的函数。如果未提供正则表达式或名称，则显示所有函数。如果声明了USER或SYSTEM，那么将分别显示用户定义的Spark SQL函数和系统定义的Spark SQL函数。示例查看当前的所有函数。 1 SHOW FUNCTIONS; 父主题：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
DLI Delta表概述 - 数据湖探索 DLI

Spark API完全兼容，并且其设计能够与结构化流式处理紧密集成，可以轻松地将单个数据副本用于批处理和流式处理操作，并提供大规模增量处理。 DLI中Delta的使用限制仅Spark 3.3.1（3.0.0）及以上版本支持Delta。 DLI支持的Delta版本是Delta 2.3.0。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

、是不是外表（external）等。 LIKE子句用于在新表中包含来自现有表的所有列定义。可以指定多个LIKE子句，从而允许从多个表中复制列。如果指定了INCLUDING PROPERTIES，则将所有表属性复制到新表中。如果WITH子句指定的属性名称与复制的属性名称相同，则将使

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

groupid 否 BIGINT BIGINT类型常量，必须大于等于0。返回值说明返回STRING类型。如果pattern为空串或pattern中没有分组，返回报错。 groupid非BIGINT类型或小于0时，返回报错。不指定时默认为1，表示返回第一个组。如果groupid等于0，则返回满足整个pattern的子串。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
函数概览 - 数据湖探索 DLI
函数概览 - 数据湖探索 DLI

<col3>) as (<key1>,<key2>,...,<col1>, <col2>) 参数的数据类型将一行数据转为多行的UDTF，将列中存储的以固定分隔符格式分隔的数组转为多行。 trunc_numeric trunc_numeric(<number>[, bigint<decimal_places>])

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
datediff - 数据湖探索 DLI
datediff - 数据湖探索 DLI

参数说明表1 参数说明参数是否必选参数类型说明 date1 是 DATE 或 STRING 计算两个时间date1、date2的日期差值中的被减数。格式为： yyyy-mm-dd yyyy-mm-dd hh:mi:ss yyyy-mm-dd hh:mi:ss.ff3 date2

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
keyvalue - 数据湖探索 DLI
keyvalue - 数据湖探索 DLI

STRING 待拆分的字符串。 split1、split2 否 STRING 用于作为分隔符的字符串，按照指定的两个分隔符拆分源字符串。如果表达式中没有指定这两项，默认split1为";"，split2为":"。当某个被split1拆分后的字符串中有多个split2时，返回结果未定义。 key

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
导出查询结果 - 数据湖探索 DLI

ions参数可以参考表3。注意事项通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute by rand()”，可以增加处理作业的并发量。例如：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
SHOW_LOG_FILE - 数据湖探索 DLI
SHOW_LOG_FILE - 数据湖探索 DLI

file的路径，支持正则匹配否 merge 执行show_logfile_records时，通过merge控制是否将多个log file中的record合并在一起返回否 limit 限制返回结果的条数否示例 call show_logfile_metadata(table

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Spark 2.4.5版本说明 - 数据湖探索 DLI

更多版本新特性请参考Release Notes - Spark 2.4.5。表1 Spark 2.4.5版本优势特性说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

在DLI执行作业时，为了避免因字符编码不一致导致的乱码问题，建议您统一数据源的编码格式。 DLI服务只支持UTF-8文本格式，因此在执行创建表和导入操作时，用户的数据需要以UTF-8编码。在将数据导入DLI之前，确保源数据文件（如CSV、JSON等）是以UTF-8编码保存的。如果数据源不是UTF

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
ALTER VIEW - 数据湖探索 DLI
ALTER VIEW - 数据湖探索 DLI

REPLACE VIEW类似。 “ALTER VIEW view_name SET TBLPROPERTIES table_properties;”中table_properties格式为 (property_name = property_value, property_name = property_value

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

RichParallelSourceFunction<Row>{}，重点实现其中的open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Hudi Archive操作说明 - 数据湖探索 DLI

hoodie.keep.min.commits=20 // 默认值为20，根据业务场景指定随后执行SQL，当执行过clean，Timeline中存在数据文件已经被清理的Instant，且总Instant数量超过30时，会触发archive。 run archivelog on ${table_name}

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护

总条数： 1034

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表初始化 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

包年包月弹性资源池设置了定时扩缩容时，怎样计费？ - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

SHOW TABLES - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

显示所有函数 - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

regexp - 数据湖探索 DLI

函数概览 - 数据湖探索 DLI

datediff - 数据湖探索 DLI

keyvalue - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

SHOW_LOG_FILE - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

ALTER VIEW - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线