搜索_华为云

Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

a8c3-28fbee399fa6"; // 调用BatchJob对象的delBatch接口取消批处理作业 MessageInfo messageInfo = client.delBatchJob(batchId); System.out.println(messageInfo

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
自定义函数参数传递 - 数据湖探索 DLI

OpenSource SQL编辑页面，自定义配置中配置参数pipeline.global-job-parameters，在UDF代码中获取该参数并使用。如需修改参数值，直接在FlinkOpenSource SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

OpenSource SQL编辑页面，自定义配置中配置参数pipeline.global-job-parameters，在UDF代码中获取该参数并使用。如需修改参数值，直接在FlinkOpenSource SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

作业时，请配置作业使用Spark3.3.1版本、且已在作业中配置允许DLI访问DEW的委托信息。自定义委托及配置请参考自定义DLI委托权限。使用该功能，所有涉及OBS的桶，都需要进行配置AKSK。语法格式在Spark Jar作业编辑界面，选择配置优化参数，配置信息如下:

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

客户创建增强型跨源连接DLI和DWS，安全组已配置出方向规则到关联队列，使用的是密码形式的跨源认证，报DLI.0999: PSQLException: The connection attempt failed。原因分析出现该问题可能原因如下：安全组配置不正确子网配置不正确处理步骤检查客户

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
导出查询结果 - 数据湖探索 DLI

写入的文件格式，支持按CSV、Parquet、ORC、JSON、Avro格式。 file_format为csv时，options参数可以参考表3。注意事项通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在I

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

戳。注意：范围以外的上界时间戳不可以在随后基于时间的操作中，作为行时间属性使用，比如基于时间窗口的join以及分组窗口或分组窗口上的聚合。 TUMBLE_ROWTIME(time_attr, interval) HOP_ROWTIME(time_attr, interval

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
ARCHIVELOG - 数据湖探索 DLI
ARCHIVELOG - 数据湖探索 DLI

ARCHIVELOG 命令功能用于根据配置对Timeline上的Instant进行归档，并从Timeline上将已归档的Instant删除，以减少Timeline的操作压力。命令格式 RUN ARCHIVELOG ON tableIdentifier; RUN ARCHIVELOG

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。关于Python开发环境的配置请参考Python SDK环境配置。 DLI Python SDK依赖第三方库包括：urllib3

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
导出SQL作业结果 - 数据湖探索 DLI

请在DLI管理控制台的“全局配置 > 工程配置”中配置桶信息。当作业完成后，系统会自动将结果存储到这个默认桶中。使用DLI作业桶读取查询结果，需具备以下条件：在DLI管理控制台“全局配置 > 工程配置”中完成作业桶的配置。作业桶配置请参考配置DLI作业桶。提交工单申请开启查询结果写入桶特性的白名单。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

Authentication failed 问题原因因为账号没有在全局配置中配置服务授权，导致该账号在创建跨源连接访问外部数据时因为权限不足而导致跨源访问失败。解决方案登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
数据操作语句DML - 数据湖探索 DLI

数据操作语句DML SELECT INSERT INTO 集合操作窗口分组聚合 Over聚合 JOIN OrderBy & Limit Top-N 去重父主题： Flink Opensource SQL1.15语法参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

据查询分析。SQL语法全兼容标准ANSI SQL 2003。存算分离 DLI解耦计算和存储负载，存算分离架构，存储资源和计算资源按需灵活配置，提高了资源利用率，降低了成本。企业级多租户支持计算资源按租户隔离，数据权限控制到队列、作业，帮助企业实现部门间的数据共享和权限管理。

帮助中心 > 数据湖探索 DLI > 产品介绍
提交SQL作业（推荐） - 数据湖探索 DLI

纯数字，且不能以下划线开头。 conf 否 Array of Strings 用户以“key/value”的形式设置用于此作业的配置参数。目前支持的配置项请参考表3。 tags 否 Array of Objects 作业的标签。具体请参考表4。 engine_type 否 String

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

TABLE所需权限列表权限描述表的ALTER权限细粒度权限：dli:table:alter。由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例 alter table h0 add columns(ext0 string); alter

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Schema演进语法说明
使用CDM迁移数据至DLI - 数据湖探索 DLI

其他可选参数保持默认即可，详细说明可参见配置MySQL源端参数。目的端作业配置目的连接名称：选择已创建的DLI连接“dlilink”。模式或表空间：选择导入到DLI的哪个模式。自动创表：这里选择“不存在时创建”，当下面“表名”参数中配置的表不存在时，CDM会自动在DLI中创建该表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

增量查询之前必须指定当前表的查询为增量查询模式，并且查询后重写设置表的查询模式如果增量查询完，不重新将表查询模式设置回去，将影响后续的实时查询示例以SQL作业为例：配置参数 hoodie.tableName.consume.mode=INCREMENTAL // 必须设置当前表读取为增量读取模式 hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

15版本使用DEW管理访问凭据，在创建作业时，请配置作业使用Flink1.15版本、且已在作业中配置允许DLI访问DEW的委托信息。自定义委托及配置请参考自定义DLI委托权限。使用该功能，所有涉及OBS的桶，都需要进行配置AKSK。语法格式在Flink jar作业编辑界面，选择配置优化参数，配置信息如下: 不

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

对表执行clean操作时需要表的owner才可以执行。如果需要修改clean默认的参数，需要在执行SQL时，在设置中配置需要保留的commit数量等参数，参见Hudi常见配置参数。使用由DLI提供的元数据服务时，本命令不支持使用OBS路径。系统响应可以检查任务状态是否成功，查看任务日志确认有无异常。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

数”的比例。如果这个比例大于配置的阈值，则认为预聚合效果不好，此时Spark可以选择跳过部分聚合，避免进一步的性能损失。在使用时系统先按照spark.sql.aggregate.adaptivePartialAggregationInterval配置的间隔进行分析，当处理的行数

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比

总条数： 619

上一页
1
...
8
9
10
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark作业相关 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

ARCHIVELOG - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

数据操作语句DML - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线