搜索_华为云

DLI中使用Delta开发作业 - 数据湖探索 DLI

DLI中使用Delta开发作业 DLI Delta元数据在DLI使用Delta提交Spark Jar作业

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
Flink OpenSource SQL作业开发 - 数据湖探索 DLI

Flink OpenSource SQL作业开发从Kafka读取数据写入到RDS 从Kafka读取数据写入到DWS 从Kafka读取数据写入到Elasticsearch 从MySQL CDC源表读取数据写入到DWS 从PostgreSQL CDC源表读取数据写入到DWS Fli

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
SQL作业开发指南 - 数据湖探索 DLI

SQL作业开发指南使用Spark SQL作业分析OBS数据在DataArts Studio开发DLI SQL作业在Spark SQL作业中使用UDF 在Spark SQL作业中使用UDTF 在Spark SQL作业中使用UDAF

帮助中心 > 数据湖探索 DLI > 开发指南
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

窗口 Top-N 是特殊的 Top-N，它返回每个分区键的每个窗口的N个最小或最大值。与普通Top-N不同，窗口Top-N只在窗口最后返回汇总的Top-N数据，不会产生中间结果。窗口 Top-N 会在窗口结束后清除不需要的中间状态。窗口 Top-N 适用于用户不需要每条数据都更新

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

AbstractMethodError Spark 2.3对内部接口Logging做了行为变更，如果用户代码里直接继承了该Logging，且编译时使用的是低版本的Spark，那么应用程序在Spark 2.3的环境中运行将会报java.lang.AbstractMethodError。解决措施有如下两种方案：

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

已经购买了DLI的套餐包，使用过程中仍然产生了按需费用。排查思路 DLI提供优惠的资源套餐包，购买套餐包后，资源按照套餐包类型计费。套餐包是用户预先购买的资源使用量配额，超出当前套餐包的额度，将自动转为按需收费。建议您按以下顺序排查原因。可能原因处理措施未购买对应的套餐包请参考判断是否经购买了对应的套餐包

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

TypeSerializer 序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi Archive操作说明 - 数据湖探索 DLI

什么是Archive Archive用户清理Hudi表的元数据文件（位于.hoodie目录下，格式为 ${时间戳}.${操作类型}.${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行的每次操作都会产生元数据文件，而元数

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，性能较好。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
字符串函数概览 - 数据湖探索 DLI

次匹配pattern的子串，以及之后匹配pattern的子串，全都替换成指定字符串replace_string后，返回结果字符适用于Spark3.3.1：用于将source字符串中第occurrence次匹配pattern的子串，以及之后匹配pattern的子串，全都替换成指定

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
查询作业详细信息 - 数据湖探索 DLI

是 String 提交作业的用户。 start_time 是 Long 作业开始的时间。是单位为“毫秒”的时间戳。 duration 是 Long 作业执行的时间间隔，单位毫秒。 export_mode 否 String 导出数据或保存查询结果时，指定的导出模式。范围为“Err

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建并提交Spark作业 - 数据湖探索 DLI

本章节指导用户通过API创建并提交Spark作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Spark作业所需的资源包。查询组内资源包：确认上传的资源包是否正确。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
创建并提交Flink作业 - 数据湖探索 DLI

场景描述本章节指导用户通过API创建并运行Flink自定义作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Flink自定义作业所需的资源包。查询组内资源包：确认上传的资源包是否正确。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

proctime表示table1的proctime处理时间属性(计算列) 使用FOR SYSTEM_TIME AS OF table1.proctime表示当左边表的记录与右边的维表join时，只匹配当前处理时间维表所对应的的快照数据。注意事项仅支持带有处理时间的 temporal tables

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

proctime表示table1的proctime处理时间属性(计算列) 使用FOR SYSTEM_TIME AS OF table1.proctime表示当左边表的记录与右边的维表join时，只匹配当前处理时间维表所对应的的快照数据。注意事项仅支持带有处理时间的 temporal tables

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
配置Hudi数据列默认值 - 数据湖探索 DLI

致部分或全部数据重写。列的默认值设置要与列的类型一致，如不一致会进行类型强转，导致默认值精度丢失或者默认值为NULL。历史数据的默认值与列第一次设置的默认值一致，多次修改列的默认值不会影响历史数据的查询结果。设置默认值后rollback不能回滚默认值配置。 Spark SQ

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
JDBC维表 - 数据湖探索 DLI
JDBC维表 - 数据湖探索 DLI

二者生成的表信息写入Kafka结果表中，其具体步骤如下：参考增强型跨源连接，在DLI上根据MySQL和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置MySQL和Kafka的安全组，添加入向规则使其对Flink的队列网段

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
创建OBS表时怎样指定OBS路径 - 数据湖探索 DLI

STRING COMMENT '用户ID') SORTED as parquet LOCATION 'obs://akc-bigdata/akdc.db' 如果指定路径为akdc.db时，进行insert overwrite操作时，会将akdc.db下的数据都清空。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类

总条数： 783

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI中使用Delta开发作业 - 数据湖探索 DLI

Flink OpenSource SQL作业开发 - 数据湖探索 DLI

SQL作业开发指南 - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

字符串函数概览 - 数据湖探索 DLI

查询作业详细信息 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Flink作业 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

JDBC维表 - 数据湖探索 DLI

创建OBS表时怎样指定OBS路径 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线