搜索_华为云

Hudi表模型设计规范 - 数据湖探索 DLI

Hudi表模型设计规范规则 Hudi表必须设置合理的主键。 Hudi表提供了数据更新和幂等写入能力，该能力要求Hudi表必须设置主键，主键设置不合理会导致数据重复。主键可以为单一主键也可以为复合主键，两种主键类型均要求主键不能有null值和空值，可以参考以下示例设置主键： SparkSQL：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
管理DLI全局变量 - 数据湖探索 DLI

管理DLI全局变量什么是全局变量 DLI支持在管理控制台设置全局变量，将作业开发过程中频繁使用的变量设置为全局变量，可以避免在编辑作业过程中重复定义，减少开发与维护成本。通过使用全局变量可以替换长难复杂变量，简化复杂参数，提升SQL语句可读性。本节操作为您介绍如何创建全局变量。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
创建Kerberos跨源认证 - 数据湖探索 DLI

创建Kerberos跨源认证操作场景通过在DLI控制台创建的Kerberos类型的跨源认证，将数据源的认证信息存储到DLI，无需在SQL作业中配置账号密码，安全访问数据源。 MRS Kafka开启Kerberos认证，未开启SSL认证时，创建Kerberos类型的认证。建表时

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
配置Flink作业权限 - 数据湖探索 DLI

配置Flink作业权限 Flink作业权限操作场景针对不同用户，可以通过权限设置分配不同的作业，不同用户之间的作业效率互不影响，保障作业性能。管理员用户和作业的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其作业权限。给新用户设置作业权限时，该用户所在用户组的所属区域需具有Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
MERGE INTO - 数据湖探索 DLI
MERGE INTO - 数据湖探索 DLI

MERGE INTO 命令功能通过MERGE INTO命令，根据一张表或子查询的连接条件对另外一张表进行查询，连接条件匹配上的进行UPDATE或DELETE，无法匹配的执行INSERT。这个语法仅需要一次全表扫描就完成了全部同步工作，执行效率要高于INSERT＋UPDATE。注意事项

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
ClickHouse结果表 - 数据湖探索 DLI

ClickHouse结果表功能描述 DLI将Flink作业数据输出到ClickHouse中。 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。详细请参考ClickHouse组件操作。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
配置DLI程序包权限 - 数据湖探索 DLI

配置DLI程序包权限针对不同用户，可以通过权限设置分配不同的程序包组或程序包，不同用户之间的作业效率互不影响，保障作业性能。管理员用户、程序包组拥有程序包组的所有权限。不需要进行权限设置，且其他用户无法修改其程序包组权限。管理员用户、程序包的所有者拥有程序包的所有权限。不需

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Doris结果表 - 数据湖探索 DLI
Doris结果表 - 数据湖探索 DLI

Doris结果表功能描述 Flink SQL作业写Doris结果表。前提条件该场景作业需要运行在DLI的独享队列上，因此要与Doris建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Doris维表 - 数据湖探索 DLI
Doris维表 - 数据湖探索 DLI

Doris维表功能描述创建Doris维表用于与输入流连接生成宽表。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
查询作业模板列表 - 数据湖探索 DLI

查询作业模板列表功能介绍该API用于查询作业模板列表。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v3/{project_id}/templates?type=spark 参数说明表1 URI参数说明参数是否必选参数类型描述

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
Doris源表 - 数据湖探索 DLI
Doris源表 - 数据湖探索 DLI

Doris源表功能描述 Flink SQL作业读取Doris源表。前提条件该场景作业需要运行在DLI的独享队列上，因此要与Doris建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Flink作业常用操作 - 数据湖探索 DLI

Flink作业常用操作用户创建了新作业后，需要根据用户的实际需求对作业进行操作，包括编辑作业基本信息，启停作业、导入/导出作业等。编辑作业用户可以对已经创建的作业进行编辑，如修改SQL语句、作业名称和描述、作业配置信息等。在DLI管理控制台的左侧导航栏中，单击“作业管理”

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
弹性资源池计费 - 数据湖探索 DLI

弹性资源池计费弹性资源池计费模式弹性资源池为DLI作业运行提供计算资源。弹性资源池支持三种计费模式：包年包月：是预付费模式，按订单的购买周期计费。拥有专属的计算资源，空闲（无作业运行）时不会释放，使用体验更佳，价格比按需计费模式更优惠。适用于可预估资源使用周期的场景，例如

 帮助中心 > 数据湖探索 DLI > 计费说明
使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用DataSource语法创建OBS表功能描述本节介绍使用DataSource语法创建OBS表。 DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。推荐使用OBS并行文件系统进行存储。并行文

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到RDS 本指导仅适用于Flink 1.12版本。场景描述该场景为根据商品的实时点击量，获取每小时内点击量最高的3个商品及其相关信息。商品的实时点击量数据为输入源发送到Kafka中，再将Kafka数据的分析结果输出到RDS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发

总条数： 738

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表模型设计规范 - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

创建Kerberos跨源认证 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

MERGE INTO - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

Doris结果表 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

Doris维表 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

Doris源表 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

弹性资源池计费 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线