搜索_华为云

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

委托权限示例请参考自定义DLI委托权限和常见场景的委托权限策略。仅支持Flink1.15版本使用DEW管理访问凭据，在创建作业时，请配置作业使用Flink1.15版本、且已在作业中配置允许DLI访问DEW的委托信息。在DLI管理控制台新建“增强型跨源连接”配置DLI与数据源的网络连通。具体操作请参考增强型跨源连接。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
查看弹性资源池的基本信息 - 数据湖探索 DLI

池。本节操作介绍在管理控制台如何查看弹性资源池基本信息，包括弹性资源池的VPC网段、IPv6网段、创建时间等信息。查看弹性资源池的基本信息登录DLI管理控制台。选择“资源管理 > 弹性资源池”。进入弹性资源池列表页面，选择您需要查看的弹性资源池。在列表页面的右上方单击

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

请确保已创建DWS数据库表。该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Flink作业常用操作 - 数据湖探索 DLI

击“更多 > 停止”。也可以在作业列表中，勾选一个作业，单击作业列表左上方的“停止”。批量停止作业勾选多个需要停止作业，单击作业列表左上方的“停止”。可以停止多个作业。在弹出的“停止作业”窗口中，单击“确认”，停止作业。图1 停止作业在停止作业之前，用户可以触发保存点

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用华为云账号登录DLI管理控制台，在左侧导航栏单击“全局配置 > 服务授权”。在委托设置页面，勾选基础使用、跨源场景、运维场景的委托权限后，单击“更新委托权限”。查看并了解更新委托的提示信息，单击“确定”。完成DLI委托权限的更新。图1 配置DLI委托访问授权完成配置后，在IAM控制台的委

 帮助中心 > 数据湖探索 DLI > 快速入门
创建弹性资源池并添加队列 - 数据湖探索 DLI

当前扩缩容策略支持的最小CU数。在全天的任意一个时间段内，弹性资源池中所有队列的最小CU数之和必须小于等于弹性资源池的最小CU数。当队列的最小CUs小于16CUs时，在队列属性中设置的“最大spark driver实例数”和“最大预拉起spark driver实例数”不生效。了解队列属性设置。 Het

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存）。弹性资源池的单位为CU，1CU包含1CPU和4GB内存。您可以在弹性资源池中创建多个队列，队列之间的计算资源支持共享。通过合理设置队列的计算资源池分配策略，提高计算资源利用率。 DLI弹性资源池之间为物理集群隔离，同一个弹性资源池中的队列之间为逻辑隔离。

帮助中心 > 数据湖探索 DLI > 产品介绍
SparkSQL建表参数规范 - 数据湖探索 DLI

建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。参数名称参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
TRUNCATE TABLE - 数据湖探索 DLI
TRUNCATE TABLE - 数据湖探索 DLI

从表或分区中移除所有行。当表属性“auto.purge”采用默认值“false”时，被删除的数据行将保存到文件系统的回收站，否则，当“auto.purge”设置为“true”时，数据行将被直接删除。限制目标表必须是管控表（表属性external=false），否则执行语句将报错。示例 -- 删除原生/管控表

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

API语法说明设置写入方式 Hudi通过hoodie.datasource.write.operation参数设置写入模式。 insert：该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
MERGE INTO - 数据湖探索 DLI
MERGE INTO - 数据湖探索 DLI

配的执行INSERT。这个语法仅需要一次全表扫描就完成了全部同步工作，执行效率要高于INSERT＋UPDATE。注意事项分区表合并需要设置参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

管理的所有文件，并删除不再处于表事务日志最新状态且超过保留期阈值的数据文件。默认阈值为 7 天。注意事项 RETAIN num HOURS表示保留期阈值，建议设置为至少 7 天。如果对 Delta 表运行VACUUM，则将无法再回头查看在指定数据保留期之前创建的版本。 Delta Lake 具有一

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
使用Hive语法创建DLI表 - 数据湖探索 DLI

double, date, timestamp等hive开源支持的类型。支持指定多个分区字段，分区字段只需在PARTITIONED BY关键字后指定，不能像普通字段一样在表名后指定，否则将出错。单表分区数最多允许200000个。 Spark 3.3及以上版本支持使用Hive语法的CTAS语句创建分区表。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
查询SQL作业日志 - 数据湖探索 DLI

配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置 > 工程配置”。在“工程配置”页面，选择“DLI作业桶”，单击配置桶信息。图1 工程配置单击打开桶列表。选择用于存放DLI作业临时数据的桶，并单击“确定”。完成设置后DLI作业运行过程中产生的临时数据将会存储在该OBS桶中。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询Spark作业日志 - 数据湖探索 DLI

配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置 > 工程配置”。在“工程配置”页面，选择“DLI作业桶”，单击配置桶信息。图1 工程配置单击打开桶列表。选择用于存放DLI作业临时数据的桶，并单击“确定”。完成设置后DLI作业运行过程中产生的临时数据将会存储在该OBS桶中。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

customer GROUP BY mktsegment; GROUPING SETS 可以指定多个列进行分组，结果列中不属于分组列的将被设置为NUll。具有复杂分组语法（GROUPING SETS、CUBE或ROLLUP）的查询只从基础数据源读取一次，而使用UNION ALL的

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6 7 8 9

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6 7 8 9

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
对象存储OBS源表 - 数据湖探索 DLI

已处理的文件在 source 的整个生命周期内存储在 state 中，因此，source 的 state 在 checkpoint 和 savepoint 时进行保存。更短的时间间隔意味着文件被更快地发现，但也意味着更频繁地遍历文件系统/对象存储。如果未设置此配置选项，则提

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
查询Flink作业日志 - 数据湖探索 DLI

配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置 > 工程配置”。在“工程配置”页面，选择“DLI作业桶”，单击配置桶信息。图1 工程配置单击打开桶列表。选择用于存放DLI作业临时数据的桶，并单击“确定”。完成设置后DLI作业运行过程中产生的临时数据将会存储在该OBS桶中。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业

总条数： 401

上一页
1
...
5
6
7
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

TRUNCATE TABLE - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

MERGE INTO - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

对象存储OBS源表 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线