搜索_华为云

入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

入门实践我们整理了从队列网络连通、不同类型的作业分析、数据迁移场景的常用开发指南和最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。表1 DLI常用开发指南与最佳实践场景操作指导描述 Spark SQL作业开发使用Spark SQL作业分析OBS数据介绍使用Spark

帮助中心 > 数据湖探索 DLI > 快速入门
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

Debezium Format 功能描述 Debezium是一个 CDC（Changelog Data Capture，变更数据捕获）的工具，可以把来自 MySQL、PostgreSQL、Oracle、Microsoft SQL Server 和许多其他数据库的更改实时流式传输到

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Upsert Kafka源表 - 数据湖探索 DLI

Upsert Kafka源表功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。作为 source，upsert-kafka 连接器生产changel

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

nk），然后 MySQL CDC Source 将多个块分配给多个 reader 以并行读取表的数据。无锁算法 MySQL CDC source 使用增量快照算法, 避免了数据库锁的使用，因此不需要 “RELOAD” 权限。并发读取增量快照读取提供了并行读取快照数据的能力。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
安全 - 数据湖探索 DLI
安全 - 数据湖探索 DLI

安全责任共担资产识别与管理身份认证与访问控制数据保护技术审计与日志服务韧性监控安全风险故障恢复更新管理认证证书

 帮助中心 > 数据湖探索 DLI > 产品介绍
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

DLI SDK简介 DLI SDK简介数据湖探索服务软件开发工具包（DLI SDK，Data Lake Insight Software Development Kit）是对DLI服务提供的REST API进行的作业提交的封装，以简化用户的开发工作。用户直接调用DLI SDK提供的接口函数即可实现使用提交DLI

帮助中心 > 数据湖探索 DLI > SDK参考
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

sql.catalog"={{custom_class}}，在提交作业之后进行变量替换。说明： Spark作业不支持自定义设置jvm垃圾回收算法。如果选择Spark版本为3.1.1时，需在Spark参数（--conf)配置跨源作业的依赖模块。配置样例请参考表2。作业特性 “所属

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表功能描述 DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

Elasticsearch 功能描述 DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch 引擎的索引中。 Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ Flink Jar作业上传配置文件操作流程自定义(JAR)作业支持上传配置文件。将配置文件通过程序包管理上传到DLI；在Flink jar作业的其他依赖文件参数中，选择创建的DLI程序包；在代码中通过ClassName

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
使用CTS审计DLI服务 - 数据湖探索 DLI

使用CTS审计DLI服务通过云审计服务，您可以记录与DLI服务相关的操作事件，便于日后的查询、审计和回溯。表1 云审计服务支持的DLI操作列表操作名称资源类型事件名称创建数据库 database createDatabase 删除数据库 database deleteDatabase

帮助中心 > 数据湖探索 DLI > 用户指南
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

ClickHouse 功能描述 DLI支持将Flink作业数据输出到ClickHouse数据库中，表类型仅支持结果表。 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
创建DLI表关联CSS - 数据湖探索 DLI

创建DLI表关联CSS 功能描述使用CREATE TABLE命令创建DLI表并关联CSS上已有的表。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

ts, value, weight) 描述：按照buckets桶的数量，为所有的value计算近似直方图，每一项的宽度使用weight。本算法大体上基于。 Yael Ben-Haim and Elad Tom-Tov, "A streaming parallel decision

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

约束与限制弹性资源池约束限制更多弹性资源池约束限制请参考弹性资源池使用约束限制。表1 弹性资源池约束限制限制项说明资源规格当前弹性资源池最大的计算资源 32000CUs。弹性资源池中可创建队列的最小CU：通用队列：4CUs SQL队列：Spark SQL队列：8CUs；HetuEngine

帮助中心 > 数据湖探索 DLI > 产品介绍
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

Kafka源表功能描述创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
下载并安装JDBC驱动包 - 数据湖探索 DLI

下载并安装JDBC驱动包操作场景 JDBC用于连接DLI服务，您可以在Maven获取JDBC安装包，或在DLI管理控制台下载JDBC驱动文件。本文介绍通过JDBC连接DLI并提交SQL作业。获取服务端连接地址连接DLI服务的地址格式为：jdbc:dli://<endPoi

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
Elasticsearch结果表 - 数据湖探索 DLI

Elasticsearch结果表功能描述 DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch中。Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表

总条数： 86

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

入门实践 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

安全 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

使用CTS审计DLI服务 - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线