搜索_华为云

创建并使用跨源链接 - 数据湖探索 DLI

创建并使用跨源链接场景描述本章节指导用户通过API创建增强型跨源连接。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。创建增强型跨源连接之前需要获取需要建立连接的服务对应VPC的ID和其所在子网的网络ID。获取VPC的ID接口，具体请参考《虚拟私有云

 帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
弹性资源池关联队列 - 数据湖探索 DLI

弹性资源池关联队列操作场景参考创建弹性资源池并添加队列创建完弹性资源池后，您可以将已有的队列关联至弹性资源池，即可将弹性资源池的资源用于后续作业的运行您可以在弹性资源池页面通过“关联队列”将队列添加到弹性资源池。还可以在队列管理页面分配队列至弹性资源池。弹性资源池Flink版本只支持1

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Flink1.7版本停止服务（EOS）公告公告说明华为云于2022年12月31 00:00（北京时间）将DLI Flink 1.7版本停止服务（EOS）。影响 DLI Flink 1.7版本停止服务（EOS）后，不再提供该软件版本相关的任何技术服务支持。建议您在执行

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
创建消息通知主题 - 数据湖探索 DLI

创建消息通知主题操作场景确定创建消息通知主题后，您可在消息通知服务的“主题管理”页面中，对相应的主题添加订阅，选择不同方式（例如短信或者邮件等）进行订阅。订阅成功后，如果作业失败，则系统将会自动发送消息到您指定的订阅终端。如果作业提交1分钟内立即失败，通常不会触发消息通知。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
管理Spark作业模板 - 数据湖探索 DLI

管理Spark作业模板操作场景在创建Spark作业时，您可以在已有的Spark样例模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。当前云平台尚未提供预置的Spark模板，但支持用户自定义Spark作业模板，本节操作介绍在Spark管理页面创建Spark模板的操作方法。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
管理Flink作业模板 - 数据湖探索 DLI

SQL作业模板 Flink OpenSource SQL作业模板描述模板的相关描述，且长度为0～512个字符。创建时间创建模板的时间。更新时间最后修改模板的时间。操作 “编辑”：对已经创建好的模板进行修改。 “创建作业”：直接在该模板下创建作业，创建完后，系统跳转到“作业管理”下的作业编辑页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

“Checkpoint间隔”为两次触发Checkpoint的间隔，执行Checkpoint机制会影响实时计算性能，配置间隔时间需权衡对业务的性能影响及恢复时长，最好大于Checkpoint的完成时间，建议设置为5分钟。 Exactly Once模式保证每条数据只被消费一次，At Least Once

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
窗口关联 - 数据湖探索 DLI
窗口关联 - 数据湖探索 DLI

和相同滚动窗口的数据会被关联在一起。这里给出一个基于 TUMBLE Window TVF 的窗口连接的例子。在下面的例子中，通过将 join 的时间区域限定为固定的 5 分钟，数据集被分成两个不同的时间窗口：[12:00,12:05) 和 [12:05,12:10)。L2 和 R2 不能 join 在一起是因为它们不在一个窗口中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
数学函数概览 - 数据湖探索 DLI

rand rand(INT seed) DOUBLE 返回大于或等于0且小于1的平均分布随机数。如果指定种子seed，则会得到一个稳定的随机数序列。 round round(DOUBLE a) DOUBLE 四舍五入。 round round(DOUBLE a, INT d) DOUBLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
开启或关闭数据多版本 - 数据湖探索 DLI

开启多版本功能后，在进行删除或修改表数据时（insert overwrite或者truncate操作），系统会自动备份历史数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作丢失数据。其他多版本SQL语法请参考多版本备份恢复数据。 DLI数据多版本功能当前

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
创建表时指定表的生命周期 - 数据湖探索 DLI

在创建表时通过TBLPROPERTIES指定表的生命周期。非分区表如果表是非分区表，根据每张表的最后修改时间，经过生命周期时间后判断是否要回收此表。分区表如果是分区表，则根据各分区的最后一次表数据被修改的时间（LAST_ACCESS_TIME）判断该分区是否该被回收。分区表的最后一个分区被回收后，该表不会被删除。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
在default队列执行DLI SQL失败，提示超时异常怎么办？ - 数据湖探索 DLI

在default队列执行DLI SQL失败，提示超时异常怎么办？问题现象使用default队列提交SQL作业，作业运行异常，排查作业日志显示Execution Timeout异常。异常日志参考如下： [ERROR] Execute DLI SQL failed. Please

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
SORT BY - 数据湖探索 DLI
SORT BY - 数据湖探索 DLI

SORT BY 功能描述按字段实现表的局部排序。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference SORT BY col_name [ASC | DESC] [,col_name [ASC | DESC],..

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
字符串函数和运算符 - 数据湖探索 DLI

substr(string, start, length) → varchar 描述：从start位置开始截取字符串，截取的长度为length。一般用于截取时间戳格式。 Select substr('2019-03-10 10:00:00',1,10); --截取到日 2019-03-10 Select

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
SQL作业运行慢如何定位 - 数据湖探索 DLI

接。在Stage中，可以看到每一个Task开始运行时间“Launch Time”，以及Task运行耗时时间“Duration”。单击“Duration”，可以根据耗时进行排序，排查是否存在单个Task耗时过长导致整体作业时间变长问题。参考图10可以看到数据倾斜时，单个任务的

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
查询批处理作业列表 - 数据湖探索 DLI

D。 cluster_name 否 String 批处理作业所在队列。 create_time 否 Long 批处理作业的创建时间。是单位为“毫秒”的时间戳。 name 否 String 批处理作业名称。 owner 否 String 批处理作业所属用户。 proxyUser 否

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

PI方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对kafka消

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
DLI经典型跨源连接下线（EOL）公告 - 数据湖探索 DLI

0-955-988或950808）与我们联系。 DLI经典型跨源连接生命周期表1 DLI经典型跨源连接生命周期功能状态 EOM时间 EOL时间 DLI经典型跨源连接计划下线，不推荐使用 2023年12月30日 2024年6月30日 EOM：End of Marketing，停止该功能销售。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

了top N的方法），同时利用相应的内置函数concat和substr将当天的00:00:00作为统计的开始时间，当天的23:59:59作为统计结束时间，并筛选出支付时间在当天凌晨00:00:00后的订单数据进行统计（为了方便模拟数据的构造，这里使用"2021-03-25 12:

帮助中心 > 数据湖探索 DLI > 最佳实践
查询所有队列 - 数据湖探索 DLI

String 队列描述信息。 owner 否 String 创建队列的用户。 create_time 否 Long 创建队列的时间。单位为“毫秒”的时间戳。 queue_type 否 String 队列的类型,。 sql general all 如果不指定，默认为“sql”。 cu_count

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）

总条数： 859

上一页
1
...
7
8
9
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建并使用跨源链接 - 数据湖探索 DLI

弹性资源池关联队列 - 数据湖探索 DLI

DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

创建消息通知主题 - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

窗口关联 - 数据湖探索 DLI

数学函数概览 - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

在default队列执行DLI SQL失败，提示超时异常怎么办？ - 数据湖探索 DLI

SORT BY - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

查询批处理作业列表 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

DLI经典型跨源连接下线（EOL）公告 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线