搜索_华为云

EXPLAIN - 数据湖探索 DLI
EXPLAIN - 数据湖探索 DLI

者多个节点执行。Fragments separation表示数据在两个节点之间进行交换。Fragment type表示一个fragment如何被执行以及数据在不同fragment之间怎样分布。 SINGLE Fragment会在单个节点上执行。 HASH Fragment会在固定

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
lead - 数据湖探索 DLI
lead - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明参数的数据类型。示例代码示例数据为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供函数相关示例。创建表logs，并添加数据，命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
库表管理标签管理 - 数据湖探索 DLI

预定义标签：在标签管理服务（简称TMS）中创建的预定义标签，属于全局标签。有关预定义标签的更多信息，请参见《标签管理服务用户指南》。本节操作介绍如何为数据库和数据表添加标签、修改标签和删除标签。数据库标签管理在DLI管理控制台的左侧导航栏中，单击“数据管理> 库表管理”。在对应数据库的操作列，选择“更多>

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

创建Spark作业 Spark作业编辑页面支持执行Spark作业，为用户提供全托管式的Spark计算服务。在总览页面，单击Spark作业右上角的“创建作业”，或在Spark作业管理页面，单击右上角的“创建作业”，均可进入Spark作业编辑页面。进入Spark作业编辑页面，页面

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
创建DLI表关联HBase - 数据湖探索 DLI

接。管理控制台操作请参考增强型跨源连接。请确保在DLI队列host文件中添加MRS集群master节点的“/etc/hosts”信息。如何添加IP域名映射，请参见《数据湖探索用户指南》中增强型跨源连接章节。该语法不支持安全集群。语法格式单个RowKey 1 2 3 4 5

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
更新Flink Jar作业 - 数据湖探索 DLI

当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Flink镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。 resume_checkpoint 否 Boolean 异常重启是否从checkpoint恢复。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明参数的数据类型。示例代码示例数据为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供函数相关示例。创建表logs，并添加数据，命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
使用DataSource语法创建OBS表 - 数据湖探索 DLI

timestampFormat 否指定CSV文件中timestamp字段的日期格式。默认值： yyyy-MM-dd HH:mm:ss mode 否指定解析CSV时的模式，有三种模式。默认值：PERMISSIVE PERMISSIVE：宽容模式，遇到错误的字段时，设置该字段为Null DROPMALFORMED:

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
新建Flink Jar作业 - 数据湖探索 DLI

当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Flink镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。 resume_checkpoint 否 Boolean 异常重启是否从checkpoint恢复。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hudi数据表Compaction规范 - 数据湖探索 DLI

要求Compaction执行合并的过程必须和实时任务解耦，通过周期调度Spark任务来完成异步Compaction，这个方案的关键之处在于如何合理的设置这个周期，周期如果太短意味着Spark任务可能会空跑，周期如果太长可能会积压太多的Compaction Plan没有去执行而导致

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Hudi Clustering操作说明 - 数据湖探索 DLI

mns），然后应用该策略重写数据。创建一个REPLACE提交，并更新HoodieReplaceCommitMetadata中的元数据。如何执行Clustering Spark SQL（设置如下参数，写数据时触发） hoodie.clustering.inline=true //

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
创建弹性资源池并添加队列 - 数据湖探索 DLI

如果所建弹性资源池属于企业项目，可选择对应的企业项目。企业项目是一种云资源管理方式，企业项目管理服务提供统一的云资源按项目管理，以及项目内的资源管理、成员管理。关于如何设置企业项目请参考《企业管理用户指南》。说明：只有开通了企业管理服务的用户才显示该参数。购买时长选择“包年/包月”计费模式时，需要

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

class 否无 String write.payload.class 参数用于定义数据合并逻辑的方式，具体来说，它指定了在合并更新操作时如何处理相同主键的多条记录。默认值 OverwriteWithLatestAvroPayload。该策略用于旧记录都会被新记录覆盖。同时也提

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
查询作业列表 - 数据湖探索 DLI

当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Flink镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。 feature 否 String 自定义作业特性。表示用户作业使用的Flink镜像类型。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
查询作业详情 - 数据湖探索 DLI

当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Flink镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。 feature 否 String 自定义作业特性。表示用户作业使用的Flink镜像类型。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

"spark.hadoop.fs.obs.secret.key"参数对应的值“yyy”需要替换为账号的SK值。 AK和SK值获取请参考：如何获取AK和SK。读取OBS桶中的“people.json”文件数据。其中“dli-test-obs01”为演示的OBS桶名，请根据实际的OBS桶名替换。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

用户在使用Flink 1.12版本，则依赖的Dis connector版本需要不低于2.0.1，详细代码参考DISFlinkConnector相关依赖，如何配置connector，详细参考自定义Flink Streaming作业。若读取DIS，且配置groupId，则需要提前在DIS的“App管理”中创建所需的App名称。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南

总条数： 318

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

EXPLAIN - 数据湖探索 DLI

lead - 数据湖探索 DLI

库表管理标签管理 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

lag - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线