搜索_华为云

Hudi Archive操作说明 - 数据湖探索 DLI

request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多会导致性能问题，所以元数据文件数量最好控制在1000以内。如何执行Archive 写完数据后archive Spark SQL（set设置如下参数，写数据时触发） hoodie.archive.automatic=true

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Hudi表分区设计规范 - 数据湖探索 DLI

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
管理Flink作业模板 - 数据湖探索 DLI

择同一标签，建议在标签管理服务（TMS）中创建预定义标签。如您的组织已经设定DLI的相关标签策略，则需按照标签策略规则为资源添加标签。标签如果不符合标签策略的规则，则可能会导致资源创建失败，请联系组织管理员了解标签策略详情。具体请参考《标签管理服务用户指南》。说明：最多支持20个标签。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
数据湖探索简介 - 数据湖探索 DLI

在于：按量计费：真正的按使用量（扫描量/CU时）计费，不运行作业时0费用。自动扩缩容：根据业务负载，对计算资源进行预估和自动扩缩容。如何访问DLI 云服务平台提供了Web化的服务管理平台，既可以通过管理控制台和基于HTTPS请求的API（Application programming

帮助中心 > 数据湖探索 DLI > 产品介绍
创建并提交SQL作业 - 数据湖探索 DLI

如果不创建该桶，将无法查看作业日志。桶名称为系统默认。在OBS管理控制台页面通过配置桶的生命周期规则，可以实现定时删除OBS桶中的对象或者定时转换对象的存储类别。具体操作请参考通过配置生命周期规则。 SQL编辑器页面可以批量执行SQL语句。作业编辑窗口常用语法采用不同颜色突出显示。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Spark 3.3.1版本说明 - 数据湖探索 DLI

支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
percent - 数据湖探索 DLI
percent - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回DOUBLE类型的值。示例代码示例数据为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供函数相关示

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

不能以下划线开头。 table_name Database中的表名，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。匹配规则为：^(?!_)(?![0-9]+$)[A-Za-z0-9_$]*$。如果特殊字符需要使用单引号（''）包围起来。 partition_specs

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
创建数据库（废弃） - 数据湖探索 DLI

新增数据库的描述信息。 enterprise_project_id 否 String 企业项目ID，“0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 tags 否 Array of Objects

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 数据库相关API（废弃）
rank - 数据湖探索 DLI
rank - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回INT类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的使用方法，本文为您提供源数据，基于源数

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
Hudi表模型设计规范 - 数据湖探索 DLI

Hudi表模型设计规范规则 Hudi表必须设置合理的主键。 Hudi表提供了数据更新和幂等写入能力，该能力要求Hudi表必须设置主键，主键设置不合理会导致数据重复。主键可以为单一主键也可以为复合主键，两种主键类型均要求主键不能有null值和空值，可以参考以下示例设置主键： SparkSQL：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
字符串函数和运算符 - 数据湖探索 DLI

音时的相似性。规则如下：表1 字符对应规则字符对应数字 a、e、h、i、o、u、w、y 0 b、f、p、v 1 c、g、j、k、q、s、x、z 2 d、t 3 l 4 m、n 5 r 6 提取字符串的首字母作为soundex的第一个值。按照上面的字母对应规则，将后面的字母

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
row - 数据湖探索 DLI
row - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回DOUBLE类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的使用方法，本文为您提供源数据，基

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

1.15升级指导。切换至新版本计算引擎对DLI资源价格是否有影响？ DLI按作业运行所需的计算资源和存储资源计费，与计算引擎版本无关。如何升级到Flink 1.15版本？在DLI管理控制台，购买弹性资源池和队列资源，用于提供执行作业所需的计算资源。在DLI管理控制台，单击“作业管理

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

1.12升级指导。切换至新版本计算引擎对DLI资源价格是否有影响？ DLI按作业运行所需的计算资源和存储资源计费，与计算引擎版本无关。如何升级到Flink 1.12版本？在DLI管理控制台，购买弹性资源池和队列资源，用于提供执行作业所需的计算资源。在DLI管理控制台，单击“作业管理

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
查询批处理作业详情 - 数据湖探索 DLI

当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Spark镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。 req_body 否 String 请求参数详情。请求示例无响应示例 { "id":

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
Hudi表使用约束 - 数据湖探索 DLI

计算引擎版本 Hudi版本 Spark 3.3.1 0.11.0 Flink 1.15 0.11.0 Hetu 2.1.0 0.11.0 如何判断队列支持的计算引擎版本：首先进入DLI的控制台界面，点击左侧菜单栏的”资源管理”-> ”队列管理”。在队列管理的界面筛选并选中需要查询

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

REGEXP_EXTRACT(string1, string2[, integer]) 将字符串 STRING1 按照 STRING2 正则表达式的规则拆分，返回指定 INTEGER1 处位置的字符串。正则表达式匹配组索引从 1 开始， 0 表示匹配整个正则表达式。此外，正则表达式匹配组索引不应超过定义的组数。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

间，例如设置时间段00-09，则时间段范围为：[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源池扩缩容策略生效规则为：在任意一个时间段周期内，优先满足所有队列的最小CU数，剩余的CU（弹性资源池最大CU-所有队列的最小CU数之和）则根据配置的优先级顺序分配，直到剩余的CU数分配完成。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
cume - 数据湖探索 DLI
cume - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回DOUBLE类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的使用方法，本文为您提供源数据，基

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数

总条数： 322

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Archive操作说明 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

percent - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

创建数据库（废弃） - 数据湖探索 DLI

rank - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

row - 数据湖探索 DLI

DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

查询批处理作业详情 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

cume - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线