搜索_华为云

管理Spark作业模板 - 数据湖探索 DLI

模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。当前云平台尚未提供预置的Spark模板，但支持用户自定义Spark作业模板，本节操作介绍在Spark管理页面创建Spark模板的操作方法。新建Spark作业模板 Spark作业模板的创建方法是在创建Spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

从第一行开始，依次为每一行分配一个唯一且连续的号码。 PARTITION BY col1[, col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的列必须为时间属性。目前仅支持proctime。升序（ ASC

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
FileSystem结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

EOS，后续版本的Flink均不再支持边缘场景的作业处理。敏感变量功能随Flink1.7 EOS，后续版本不再支持敏感变量。 Flink 1.7版本停止服务后，正在使用该版本的作业有哪些影响？在Flink 1.7 EOS后创建的队列，在执行作业时不支持选择已经EOS的计算引擎。历史创建的队列使用Flink

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

从第一行开始，依次为每一行分配一个唯一且连续的号码。 PARTITION BY col1[, col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的列必须为时间属性。目前仅支持proctime。升序（ ASC

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
窗口关联 - 数据湖探索 DLI
窗口关联 - 数据湖探索 DLI

当执行窗口关联时，所有具有相同 key 和相同滚动窗口的数据会被关联在一起。这里给出一个基于 TUMBLE Window TVF 的窗口连接的例子。在下面的例子中，通过将 join 的时间区域限定为固定的 5 分钟，数据集被分成两个不同的时间窗口：[12:00,12:05) 和 [12:05

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

Integer MySQL数据库的端口号。 server-id 否 5400~6000随机值 String 数据库客户端的一个数字ID，该ID必须是MySQL集群中全局唯一的。建议针对同一个数据库的每个作业都设置一个不同的ID。默认会随机生成一个5400~6400的值。 scan.startup

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
禁止或恢复表的生命周期 - 数据湖探索 DLI

disable 否禁止表或指定分区的生命周期功能。禁止表本身及其所有分区被生命周期回收，优先级高于恢复表分区生命周期。即当使用禁止表或指定分区的生命周期功能时，设置待禁止或恢复生命周期的表的分区信息是无效的。禁止表的生命周期功能后，表的生命周期配置及其分区的enable和disable标记会被保留。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
对象存储OBS结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

从第一行开始，依次为每一行分配一个唯一且连续的号码。 PARTITION BY col1[, col2...]: 指定分区的列，例如去重的键。 ORDER BY time_attr [asc|desc]: 指定排序的列。所指定的列必须为时间属性。目前仅支持proctime。升序（ ASC

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
查询Spark作业日志 - 数据湖探索 DLI

您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。 Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
管理Flink作业模板 - 数据湖探索 DLI

描述模板的相关描述，且长度为0～512个字符。创建时间创建模板的时间。更新时间最后修改模板的时间。操作 “编辑”：对已经创建好的模板进行修改。 “创建作业”：直接在该模板下创建作业，创建完后，系统跳转到“作业管理”下的作业编辑页面。更多： “删除”：将已经创建的模板删除。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
SQL作业如何指定表的部分字段进行表数据的插入 - 数据湖探索 DLI

SQL作业如何指定表的部分字段进行表数据的插入如果需要将数据插入到表中，但只想指定部分字段，可以使用INSERT INTO语句结合SELECT子句来实现。但是DLI目前不支持直接在INSERT INTO语句中指定部分列字段进行数据插入，您需要确保在SELECT子句中选择的字段数量和类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

不支持队列类型切换，如需使用其他队列类型，请重新购买新的队列。管理队列不支持切换队列的计费模式。队列不支持切换区域。创建队列时（非弹性资源池模式的队列），仅支持包年包月队列和按需专属队列选择跨AZ双活，且跨AZ的队列价格为单AZ模式下的2倍。 DLI队列不支持访问公网。队列扩缩容

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
数据湖探索简介 - 数据湖探索 DLI

DLI是无服务器化的大数据查询分析服务，其优势在于：按量计费：真正的按使用量（扫描量/CU时）计费，不运行作业时0费用。自动扩缩容：根据业务负载，对计算资源进行预估和自动扩缩容。如何访问DLI 云服务平台提供了Web化的服务管理平台，既可以通过管理控制台和基于HTTPS请求的API（Application

帮助中心 > 数据湖探索 DLI > 产品介绍
OpenTSDB结果表 - 数据湖探索 DLI
OpenTSDB结果表 - 数据湖探索 DLI

OpenTSDB是基于HBase分布式的，可伸缩的时间序列数据库。OpenTSDB的设计目标是用来采集大规模集群中的监控类信息，并可实现数据的秒级查询，解决海量监控类数据在普通数据库中查询存储的局限性，可用于系统监控和测量、物联网数据、金融数据和科学实验结果数据的收集监控。 DLI可以通过

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
怎样排查DLI计费异常？ - 数据湖探索 DLI

是否使用自建的队列。是否执行SQL作业。如果使用了按需的弹性资源池下的队列执行作业，默认的计费模式是按CU时计费。计费详情可参考《数据湖探索价格详情》。如果使用的是default队列执行作业，则按照扫描量计费。计费详情可参考《数据湖探索价格详情》。如果在扣费时间段内没有执

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
开启或关闭数据多版本 - 数据湖探索 DLI

开启或关闭数据多版本功能描述 DLI提供多版本功能，用于数据的备份与恢复。开启多版本功能后，在进行删除或修改表数据时（insert overwrite或者truncate操作），系统会自动备份历史数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作丢失数据。其他多版本SQL语法请参考多版本备份恢复数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
续费概述 - 数据湖探索 DLI
续费概述 - 数据湖探索 DLI

在到期前续费成功，所有资源得以保留，且作业的运行不受影响。资源到期后的状态说明，请参见到期后影响（适用于包年/包月计费模式）。续费相关的功能包年/包月的DLI资源续费相关的功能如表1所示。表1 续费相关的功能功能说明手动续费包年/包月的DLI资源从购买到被自动删除之前，您

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对kafka消息进行过滤，则可以考虑先实时

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例

总条数： 1276

上一页
1
...
5
6
7
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理Spark作业模板 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

窗口关联 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

SQL作业如何指定表的部分字段进行表数据的插入 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

OpenTSDB结果表 - 数据湖探索 DLI

怎样排查DLI计费异常？ - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

续费概述 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线