搜索_华为云

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

'obs://dli-test-obs01/MyUDAF-1.0-SNAPSHOT.jar'; 重启原有SQL队列，使得创建的Function生效。登录数据湖探索管理控制台，选择“资源管理”》“队列管理”，在对应“SQL队列”类型作业的“操作”列，单击“更多”》“重启”。在“重启队列”界面，选择“确定”完成队列重启

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

'obs://dli-test-obs01/MyUDTF-1.0-SNAPSHOT.jar'; 重启原有SQL队列，使得创建的UDTF函数生效。登录数据湖探索管理控制台，选择“资源管理 > 队列管理”，在对应“SQL队列”类型作业的“操作”列，单击“重启”。在“重启队列”界面，选择“确定”完成队列重启。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

incremental.snapshot.chunk.key-column 指定的列的行为决定：如果指定的列不存在更新操作，此时可以保证 Exactly once 语义。如果指定的列存在更新操作，此时只能保证 At least once 语义。但可以结合下游，通过指定下游主键，结合幂等性操作来保证数据的正确性。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

有 4 列 (id, name, description and weight). 上面的 JSON 消息是 PRODUCTS 表上的一条更新事件，其中 id = 111 的行的 weight 值从 5.18 更改为 5.15。 { "before": { "id":

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
从Kafka读取数据写入到RDS - 数据湖探索 DLI

名称：填写具体的队列名称。新建的队列名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。长度限制：1~128个字符。队列名称不区分大小写，系统会自动转换为小写。类型：队列类型选择“通用队列”。“按需计费”时需要勾选“专属资源模式”。 AZ策略、CPU架构、规格：保持默认即可。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

是否跳过null。如果为false，则设置为字符串"null"。 ignore-retractions 否 false Boolean 连接器应忽略更新插入/撤回流模式下的收回消息。 key-column 否无 String Redis 表schema的key sink.delivery-guarantee

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

disConfig.put(DisConsumerConfig.GROUP_ID_CONFIG, groupId); // 是否主动更新分片信息及更新时间间隔（毫秒），若有主动扩缩容需求，可以开启 disConfig.put(FlinkDisConsumer.KEY

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

L products 表有4列（id，name，description 和 weight）。JSON 消息是 products 表上的一个更新事件，表示 id = 111 的行数据上 weight 字段值从5.15变更成为 5.18。 { "data": [ {

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

如果JDBC结果表定义了主键，则连接器以upsert模式运行，否则，连接器以Append模式运行。 upsert模式：Flink会根据主键插入新行或更新现有行，Flink可以通过这种方式保证幂等性。为保证输出结果符合预期，建议为表定义主键。 Append模式：Flink 会将所有记录解释为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
管理Flink作业模板 - 数据湖探索 DLI

SQL作业模板 Flink OpenSource SQL作业模板描述模板的相关描述，且长度为0～512个字符。创建时间创建模板的时间。更新时间最后修改模板的时间。操作 “编辑”：对已经创建好的模板进行修改。 “创建作业”：直接在该模板下创建作业，创建完后，系统跳转到“作业管理”下的作业编辑页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

STREAMING模式下支持。示例下面的示例展示了一个经典的业务流水线，维度表来自 Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

队列列表单击“全局配置 > 服务授权”，选中“VPC Administrator”，单击“更新委托权限”，赋予DLI操作用户VPC资源的权限，用于创建VPC的“对等连接”。图10 更新委托权限单击“跨源连接 > 增强型跨源 > 创建”，配置如下连接信息后单击“确定”。连接名称：增强型跨源名称。

帮助中心 > 数据湖探索 DLI > 最佳实践
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

单击右侧导航栏中的 “调度配置”。选择周期调度，并设置调度属性。本例中，该作业的调度策略从2024/11/22 10:15:00开始生效，且首次执行调度的时间是2024/11/22 10:20:00，调度周期间隔1天，即后续每天10:20:00 AM会自动调度这些这个作业，

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

skip-null-values 否 true Boolean 是否跳过null。 ignore-retractions 否 false Boolean 连接器应忽略更新插入/撤回流模式下的收回消息。 key-column 否无 String Redis 表schema的key source.parallelism

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

exec.batch-lookup.enabled' 选项 ignore-retractions 否 false Boolean 连接器应忽略更新插入/撤回流模式下的收回消息。 key-column 否无 String Redis 表schema的key 示例从Kafka源表中读

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

cache被启用时，每个进程（即TaskManager）将维护一个缓存。Flink将优先查找缓存，只有当缓存未查找到时才向外部数据库发送请求，并使用返回的数据更新缓存。当缓存命中最大缓存行Lookup.cache.max-rows或当行超过最大存活时间Lookup.cache.ttl时，缓存中最先添

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

只要刷新表，那么依赖该表的其他缓存都会执行uncache操作。升级引擎版本后是否对作业有影响： DLI功能增强，保证表刷新操作能对缓存生效，提高程序健壮性。 ADD PARTITION新增支持使用类型化文字说明： Spark2.4.x：在Spark 2.4.x版本中，使用ADD

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比

总条数： 217

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线