搜索_华为云

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区修剪优化，有助于减少内存使用，避免内存溢出和频繁的Full GC。但禁用此优化可能会降低查询性能，禁用后Spark将不会自动修剪掉那些不满足条件的分区。更多属性参数配置请参考DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

a8c3-28fbee399fa6"; // 调用BatchJob对象的delBatch接口取消批处理作业 MessageInfo messageInfo = client.delBatchJob(batchId); System.out.println(messageInfo

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

Objects Flink SQL作业的标签。具体请参考表3。 runtime_config 否 String Flink作业运行时自定义优化参数。 flink_version 否 String Flink版本。表3 tags参数参数名称是否必选参数类型说明 key 是

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hudi Clustering操作说明 - 数据湖探索 DLI

的文件组中，直到达到指定大小为止，但其会增加摄取延迟。为能够支持快速摄取的同时不影响查询性能，引入了Clustering服务来重写数据以优化Hudi数据湖文件的布局。 Clustering服务可以异步或同步运行，Clustering会添加了一种新的REPLACE操作类型，该操作

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
CREATE TABLE语句 - 数据湖探索 DLI

order_time - INTERVAL '5' SECOND ) WITH ( . . . ); PRIMARY KEY 主键用作 Flink 优化的一种提示信息。主键限制表明一张表或视图的某个（些）列是唯一的并且不包含 Null 值。主键声明的列都是非 nullable 的。因此主键可以被用作表行级别的唯一标识。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
创建DLI自定义委托权限 - 数据湖探索 DLI

Flink作业”。选择待编辑的Flink Jar作业，单击操作列的“编辑”。在作业配置区域配置委托信息： Flink版本：选择1.15。优化参数：配置新建的委托key-value信息，key固定为“flink.dli.job.agency.name”，value为自定义的委托名。

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？问题现象 Jobmanager与Taskmanager心跳超时，导致Flink作业异常。图1 异常信息根因分析检查网络是否发生闪断，分析集群负载是否很高。如果频繁出现Full GC, 建议排查代码，确认是否有内存泄漏。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据导出SQL作业结果 OBS 2.0支持 DLI Spark作业 DLI在开源Spark基础上进行了大量的性能优化与服务化改造，兼容Apache Spark生态和接口，执行批处理任务。 DLI还支持使用Spark作业访问DLI元数据，具体请参考《数据湖探索开发指南》。

帮助中心 > 数据湖探索 DLI > 功能总览
DLI弹性资源池与队列简介 - 数据湖探索 DLI

弹性资源池模式可以比作“租车”，您可以根据实际需求动态调整资源的规模。这种模式适合于业务需求波动较大的场景，灵活地根据业务峰谷来调整资源，优化成本。全局共享模式可以比作“打车”，您只需为实际使用的数据量付费。这种模式适合于不确定数据量大小或仅需要偶尔进行数据处理的场景，按需使用资源，无需预先购买或预留资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用CTS审计DLI服务 - 数据湖探索 DLI

edsconnection deleteRoute 创建批处理作业 jobs createBatch 取消批处理作业 jobs cancelBatch 创建全局变量 variable createGlobalVariable 删除全局变量 variable deleteGlobalVariable

帮助中心 > 数据湖探索 DLI > 用户指南
查看Flink作业详情 - 数据湖探索 DLI

Flink 版本作业所选的Flink作业的版本。所属队列 Flink作业所属的队列名称。 UDF Jar 配置UDF Jar参数时显示。优化参数作业添加了自定义参数配置时显示该参数。 CU数量作业配置的CU数量。管理单元作业配置的管理单元CU数量。并行数作业配置的同时运行Flink作业的任务数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
查询作业列表 - 数据湖探索 DLI

异常自动重启时，是否从最新checkpoint恢复。默认值为“false”。 runtime_config 否 String Flink作业运行时自定义优化参数。 graph_editor_enabled 否 Boolean 流图编辑开关。默认为“false”。 graph_editor_data

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hudi常见配置参数 - 数据湖探索 DLI

引查找。 true hoodie.bloom.index.use.treebased.filter 为true时，启用基于间隔树的文件过滤优化。与暴力模式相比，此模式可根据键范围加快文件过滤速度。 true hoodie.bloom.index.bucketized.checking

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
Flink Jar作业开发基础样例 - 数据湖探索 DLI

从而实现最小化提交，避免依赖包与flink内核中依赖包冲突：仅Flink 1.15版本支持Flink Jar作业最小化提交，通过在运行优化参数中配置flink.dli.job.jar.minimize-submission.enabled=true可以开启最小化提交。 Fli

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
查询作业详情 - 数据湖探索 DLI

否 String 静态流图资源预估参数，以json的形式展示。 runtime_config 否 String Flink作业运行时自定义优化参数。 real_cu_number 否 Integer 实际使用的CU数。默认值为“0”，表示此时以“cu_number”的值为准。请求示例

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

导出的CSV文件中舍弃这些引号。例如，字段值"a\rb"在导出时不会包含引号。 Spark3.3.x：在Spark 3.3.x版本中，优化了对于CSV文件的导出处理，如果字段值中包含特殊字符，并且这些特殊字符被引号包围，Spark会保留这些引号。例如：字段值"a\rb"在导

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

基本概念弹性资源池专属的计算资源，不同弹性资源上的计算资源完全隔离，弹性资源池内的不同队列资源可以共享，并可以根据队列资源负载配置策略进行分时弹性扩缩容，满足不同的业务需求。 DLI存储资源 DLI存储资源是DLI服务内部存储的资源，用于存储数据库和DLI表，是向DLI导入数

 帮助中心 > 数据湖探索 DLI > 产品介绍
DLI对接LakeFormation - 数据湖探索 DLI

flink.dli.job.agency.name=agency 委托权限示例请参考创建DLI自定义委托权限和常见场景的委托权限策略。 - 优化参数配置Flink作业访问的元数据类型。本场景下请选择Lakeformation。 flink.dli.job.catalog.type=lakeformation

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

long 可以缓冲的最大输入记录数，以便进行批量查找连接。 lookup.batch 否 false Boolean 指定是否启用批量查找优化。如果启用，用户必须同时设置 lookup.batch.interval 和 lookup.batch.size 选项。此外，由于底层批处理间隔干扰机制的实现，用户必须在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis

总条数： 84

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

使用CTS审计DLI服务 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线