搜索_华为云

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

业需要访问DWS、RDS等数据时，需要创建跨源连接。创建的跨源连接需要和弹性资源池进行绑定。创建增强型跨源连接步骤四：运行作业根据业务需求创建和提交作业。管理SQL作业 Flink作业概述创建Spark作业步骤一：创建弹性资源池登录DLI管理控制台，在左侧导航栏单击“资源管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

save(basePath) 设置分区多级分区配置项说明 hoodie.datasource.write.partitionpath.field 配置为多个业务字段，用逗号分隔。 hoodie.datasource.hive_sync.partition_fields 和hoodie.datasource

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

该计费模式的队列为专属队列。按需计费：建议购买cu时套餐包享受优惠。区域选择所在的区域。不同区域的云服务之间内网互不相通；请就近选择靠近您业务的区域，可减少网络时延，提高访问速度。项目每个区域默认对应一个项目，这个项目由系统预置。名称队列的名称。只能包含数字、英文字母和

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

join关联维表的最新分区，仅在Flink STREAMING模式下支持。示例下面的示例展示了一个经典的业务流水线，维度表来自 Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

步骤2：创建弹性资源池并添加队列创建提交作业所需的计算资源。步骤3：创建数据库 DLI元数据是SQL作业开发的基础。在执行作业前您需要根据业务场景定义数据库和表。步骤4：创建表数据库创建完成后，需要在数据库db1中基于OBS上的样本数据创建表。步骤5：查询数据使用标准SQL语句进行数据的查询和分析。

帮助中心 > 数据湖探索 DLI > 快速入门
创建Bucket索引表调优 - 数据湖探索 DLI

方法二：大粒度分区（推荐），如果使用分区表则需要根据数据增长情况来计算，例如使用年分区，这种方式相对麻烦些但是多年后表无需重新导入。方法三：数据老化，按照业务逻辑分析大的维度表是否可以通过数据老化清理无效的维度数据从而降低数据规模。数据量非常小的事实表这种可以在预估很长一段时间的数据增长量的

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi表模型设计规范 - 数据湖探索 DLI

启等场景。通过设置合理precombine字段值可以保证数据的准确性，老数据不会覆盖新数据，也就是幂等写入能力。该字段可用选择的类型包括：业务表中更新时间戳、数据库的提交时间戳等。precombine字段不能有null值和空值，可以参考以下示例设置precombine字段： SparkSQL:

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
ClickHouse结果表 - 数据湖探索 DLI

登录MRS管理控制台，选择“集群名称 > 组件管理 > ClickHouse > 实例”，获取ClickHouseBalancer实例的业务IP。 ClickHouseBalancer实例的http端口：登录MRS管理控制台，选择“集群名称 > 组件管理 > ClickHouse

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
ClickHouse结果表 - 数据湖探索 DLI

登录MRS管理控制台，选择“集群名称 > 组件管理 > ClickHouse > 实例”，获取ClickHouseBalancer实例的业务IP。 ClickHouseBalancer实例的http端口：登录MRS管理控制台，选择“集群名称 > 组件管理 > ClickHouse

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

用户或应用程序通过凭据管理服务，创建、检索、更新、删除凭据，轻松实现对敏感凭据的全生命周期的统一管理，有效避免程序硬编码或明文配置等问题导致的敏感信息泄露以及权限失控带来的业务风险。本节操作介绍Flink Opensource SQL场景使用DEW管理和访问凭据的操作指导。前提条件已在DEW服务创建通用凭证

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Management Service，CSMS），对AKSK统一管理，有效避免程序硬编码或明文配置等问题导致的敏感信息泄露以及权限失控带来的业务风险。本例以获取访问OBS的AKSK为例介绍Spark Jar使用DEW获取访问凭证读写OBS的操作指导。前提条件已在DEW服务创建

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Flink作业管理提供Flink作业管理界面功能介绍。 Flink模板管理提供Flink作业样例模板和自定义模板功能介绍。您可以根据习惯和业务需要自定义作业模板，方便后续创建提交作业。开发指南 Flink SQL语法参考提供Flink OpenSource SQL创建源表、结果表和维表的语法说明和样例指导。

帮助中心 > 数据湖探索 DLI > 快速入门
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

x时spark.hadoopRDD.ignoreEmptySplits=true。升级引擎版本后是否对作业有影响：有影响，需要判断是否使用分区名做业务判断。 eventlog的压缩格式设置为zstd 说明： Spark3.3.x版本中，spark.eventLog.compression

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

提交作业终止时间，单位：秒。 dli-jdbc-1.x dli-jdbc-2.x directfetchthreshold 否 1000 请您根据业务情况判断返回结果数是否超过设置的阈值。默认阈值1000。 dli-jdbc-1.x 创建Statement对象，设置相关参数并提交Spark

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

s_data 由于作业在触发CheckPoint时才会往Hudi表中写数据，所以需要开启CheckPoint。CheckPoint间隔根据业务需要调整，建议间隔调大。如果CheckPoint间隔太短，数据来不及刷新会导致作业异常；建议CheckPoint间隔为分钟级。 chec

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境自定义镜像应用场景通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Management Service，CSMS），对AKSK统一管理，有效避免程序硬编码或明文配置等问题导致的敏感信息泄露以及权限失控带来的业务风险。本例以获取访问OBS的AKSK为例介绍Flink Jar使用DEW获取访问凭证读写OBS的操作指导。前提条件已在DEW服务创建

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
使用DataSource语法创建DLI表 - 数据湖探索 DLI

col_1 = 'Ann'; 示例4：创建DLI非分区表，并自定义列字段数据类型示例说明：创建名为table2的DLI非分区表，您可以根据业务需求自定义列子段的原生数据类型：与文字字符有关可以使用STRING、CHAR或者VARCHAR。与时间有关的可以使用TIMESTAMP、DATE。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

告警通知的行动规则：建议开启告警通知的行动规则，确保告警时可以通过邮件或者短信等方式获取通知。配置时选择2中配置的告警行动规则。相关操作预定义仪表盘不能满足业务需求时，您可以按需自定义仪表盘。具体操作请参考自定义仪表盘。父主题：使用AOM监控DLI服务

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

点。因此如果有大量相同的Server ID的客户端一起连接MySQL SERVER，可能导致MySQL SERVER的CPU陡增，影响线上业务稳定性。此外，多个作业共享相同的Server ID，会导致Binlog位点错乱，多读或少读数据，因此建议每个CDC作业都配置不同的Server

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表

总条数： 129

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线