搜索_华为云

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

带宽资源独占式的Kafka专享实例。 Kafka版支持按需和包周期两种付费模式。Kafka计费项包括Kafka实例和Kafka的磁盘存储空间。了解Kafka计费说明。 RDS MySQL 数据库 RDS for MySQL提供在线云数据库服务。 RDS对您选择的数据库实例、数据库存储和备份存储（可选）收费。

帮助中心 > 数据湖探索 DLI > 最佳实践
（推荐）DLI SDK V3 - 数据湖探索 DLI

（推荐）DLI SDK V3 写作说明本文介绍了DLI服务提供的V3版本的SDK，列举了最新版本SDK的获取地址。 SDK列表表1提供了DLI云服务支持的SDK列表，您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。表1 SDK列表编程语言 Github地址

 帮助中心 > 数据湖探索 DLI > SDK参考
查看建表语句 - 数据湖探索 DLI

参数说明表1 参数说明参数描述 table_name 表名称。注意事项语句所涉及的表必须存在，否则会出错。示例 Saprk 2.4.5版本示例：执行以下命令返回测试表testDB01.testTable5的建表语句 SHOW CREATE TABLE testDB01.testTable5

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
状态码 - 数据湖探索 DLI
状态码 - 数据湖探索 DLI

切换协议。只能切换到更高级的协议。例如，切换到HTTP的新版本协议。 200 Success 服务器已成功处理了请求。通常，这表示服务器提供了请求的网页。 201 Created 请求成功且服务器已创建了新的资源。 202 Accepted 已经接受请求，但未处理完成。 203 Non-Authoritative

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代

 帮助中心 > 数据湖探索 DLI > 用户指南
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
DWS Connector概述 - 数据湖探索 DLI

DWS Connector概述数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DLI将Flink作业从数据仓库服务（DWS）中读取数据。DWS数据库内核兼容PostgreSQ

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DWS源表（不推荐使用） - 数据湖探索 DLI

包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。推荐使用DWS服务自研的DWS Connector。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

适用场景基础版 16-64CUs规格不支持高可靠与高可用。不支持设置队列属性和作业优先级。不支持对接Notebook实例。其他弹性资源池使用相关约束限制请参考弹性资源池使用约束限制。适用于对资源消耗不高、对资源高可靠性和高可用性要求不高的测试场景。标准版 64CUs及以上规格

 帮助中心 > 数据湖探索 DLI > 产品介绍
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

选择使用Flink1.15版本时请在作业中配置允许DLI访问的云服务的委托信息。 Flink 1.15版本语法请参考Flink OpenSource SQL1.15版本使用说明、Flink OpenSource SQL1.15语法。 Flink 1.12版本语法请参考Flink OpenSource

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

配置数据更新间隔。示例该示例展示了一个经典的业务流水线，维度表来自 Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE TABLE if

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到RDS 本指导仅适用于Flink 1.12版本。场景描述该场景为根据商品的实时点击量，获取每小时内点击量最高的3个商品及其相关信息。商品的实时点击量数据为输入源发送到Kafka中，再将Kafka数据的分析结果输出到RDS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
DLI作业开发流程 - 数据湖探索 DLI

详细操作请参考创建并提交SQL作业。适用于数据仓库查询、报表生成、OLAP（在线分析处理）等场景。 Flink作业专为实时数据流处理设计，适用于低时延、需要快速响应的场景。适用于实时监控、在线分析等场景。 Flink OpenSource作业：DLI提供了标准的连接器（co

帮助中心 > 数据湖探索 DLI > 用户指南
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

表示永久不失效。 compaction.async.enabled 否 false Boolean 是否开启在线压缩。 true：开启 false：关闭建议关闭在线压缩，提升性能。但是调度compaction.schedule.enabled仍然建议开启，之后可通过离线异步压缩，执行阶段性生成的压缩plan。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
Hudi开发规范概述 - 数据湖探索 DLI

基于DLI-Hudi进行数据存储、数据加工作业的设计、开发、测试和维护。该设计开发规范是基于Spark 3.3.1，Hudi 0.11.0版本。父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

Flink版本是选择作业运行时所使用的Flink的版本。本例选择使用Flink1.15版本时请在作业中配置允许DLI访问的云服务的委托信息。委托否选择Flink1.15版本时需要用户自行配置委托，否则可能影响作业运行。 Flink Jar作业的高级配置。参考表6配置Flink

帮助中心 > 数据湖探索 DLI > 快速入门
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch 本指导仅适用于Flink 1.12版本。场景描述本示例场景对用户购买商品的数据信息进行分析，将满足特定条件的数据结果进行汇总输出。购买商品数据信息为数据源发送到Kafka中，再将Kafka数据的分析结果输出到Elasticsearch中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

示例下面的示例展示了一个经典的业务流水线，维度表来自 Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE TABLE if

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
从Kafka读取数据写入到DWS - 数据湖探索 DLI

从Kafka读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述该场景为对汽车驾驶的实时数据信息进行分析，将满足特定条件的数据结果进行汇总。汽车驾驶的实时数据信息为数据源发送到Kafka中，再将Kafka数据的分析结果输出到DWS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发

总条数： 54

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

查看建表语句 - 数据湖探索 DLI

状态码 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

Hudi开发规范概述 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线