搜索_华为云

基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

通常用于结构化数据的查询和分析。 Flink作业 Flink作业专为实时数据流处理设计，适用于低时延、需要快速响应的场景。适用于实时监控、在线分析等场景。 Flink OpenSource作业：提交作业时可以使用DLI提供的标准的连接器（connectors）和丰富的API，快速与其他数据系统的集成。

帮助中心 > 数据湖探索 DLI > 产品介绍
数据湖探索简介 - 数据湖探索 DLI

SQL作业支持SQL查询功能：可为用户提供标准的SQL语句。具体内容请参考《数据湖探索SQL语法参考》。 Flink作业支持Flink SQL在线分析功能：支持Window、Join等聚合函数，用SQL表达业务逻辑，简便快捷实现业务。具体内容请参考Flink OpenSource SQL语法参考。

帮助中心 > 数据湖探索 DLI > 产品介绍
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

成长地图由浅入深，带您玩转DLI 01 了解初步认识华为云数据湖探索，了解数据湖探索的基本功能、应用场景、基本概念和使用限制，有助于您更准确地匹配实际业务。产品介绍什么是DLI 应用场景使用限制与其他云服务的关系 03 入门购买DLI队列后，您可以运行SQL作业和Spark作业，开启您的数据湖探索使用之旅。

帮助中心 > 数据湖探索 DLI > 成长地图
数据保护技术 - 数据湖探索 DLI

security.ssl.verify-hostname 用于控制在建立SSL/TLS连接时是否验证对端的主机名（hostname）与证书中的信息是否匹配。否 false security.ssl.protocol 指定SSL/TLS连接时所使用的协议版本否 TLSv1.2、TLSv1.3

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下已在数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

表中；同时您也可以将文件或文件夹拖拽到指定的目录上，这样可以上传到指定的目录中。单击Best_Practice_01.zip获取本示例的测试数据，将“Best_Practice_01.zip”压缩包解压。后续操作说明如下：详单数据：将解压后Data目录下的“detail-re

帮助中心 > 数据湖探索 DLI > 最佳实践
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

属性(计算列) 使用FOR SYSTEM_TIME AS OF table1.proctime表示当左边表的记录与右边的维表join时，只匹配当前处理时间维表所对应的的快照数据。注意事项仅支持带有处理时间的 temporal tables 的 inner 和 left join

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

属性(计算列) 使用FOR SYSTEM_TIME AS OF table1.proctime表示当左边表的记录与右边的维表join时，只匹配当前处理时间维表所对应的的快照数据。注意事项仅支持带有处理时间的 temporal tables 的 inner 和 left join

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
Hudi常见配置参数 - 数据湖探索 DLI

copyonwrite.insert.split.size 插入写入并行度。为单个分区的总共插入次数。写出100MB的文件，至少1KB大小的记录，意味着每个文件有100K记录。默认值是超额配置为500K。为了改善插入延迟，请对其进行调整以匹配单个文件中的记录数。将此值设置为较小的值将导致文件变小

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

属性(计算列) 使用FOR SYSTEM_TIME AS OF table1.proctime表示当左边表的记录与右边的维表join时，只匹配当前处理时间维表所对应的的快照数据。注意事项仅支持带有处理时间的 temporal tables 的 inner 和 left join

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

进入云服务器的根目录/bin执行以下命令启动kyuubi。 cd /bin ./kyuubi start restart 连接成功后，可以执行SQL查询来测试Kyuubi与DLI的连接是否正常工作。（可选）配置主机的host文件提高Kyuubi的访问效率为了提高Kyuubi的访问效率，建议在主机的/etc/hosts

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

如果设置为是，任务启动前会清除目标表中数据。更多参数的详细配置可以参考：CDM配置DLI目的端参数。单击“下一步”，进入到字段映射界面，CDM会自动匹配源和目的字段。如果字段映射顺序不匹配，可通过拖拽字段调整。如果选择在目的端自动创建类型，这里还需要配置每个类型的字段类型、字段名称。 CDM支持迁移过程中转换字段内容

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

topic名。该参数和“connector.topic-pattern”两个参数只能使用其中一个。 connector.topic-pattern 否匹配读取kafka topic名称的正则表达式。该参数和“connector.topic”两个参数只能使用其中一个。例如： 'topic.*'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

如果设置为是，任务启动前会清除目标表中数据。详细的参数配置可以参考：CDM配置DLI目的端参数。单击“下一步”，进入到字段映射界面，CDM会自动匹配源和目的字段。如果字段映射顺序不匹配，可通过拖拽字段调整。如果选择在目的端自动创建类型，这里还需要配置每个类型的字段类型、字段名称。 CDM支持迁移过程中转换字段内容，详细请参见字段转换。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下已在数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

且不能以下划线开头。 table_name Database中的表名，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。匹配规则为：^(?!_)(?![0-9]+$)[A-Za-z0-9_$]*$。如果特殊字符需要使用单引号（''）包围起来。该命令仅支持操作OBS表，不支持对DLI表进行操作。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
导入数据（废弃） - 数据湖探索 DLI

禁止使用IP地址。如果名称中包含英文句号（.），访问桶或对象时可能会进行安全证书校验。导入源文件时，如果源文件中的某一列与目标表列类型不匹配，将会导致该行数据的查询结果为null 。不支持并发导入同一张表。调试您可以在API Explorer中调试该接口。 URI URI格式：

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
查询作业模板列表 - 数据湖探索 DLI

模板类型。取值范围： SPARK：Spark模板。当前只支持配置Spark类型的模板。 keyword 否 String 模板名过滤关键字，模糊匹配，获取模板名含有该关键字的所有模板。 page-size 否 Integer 每页显示的最大结果行数，范围: [1, 100]。默认值为：50。

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

开发流程说明序号阶段操作界面说明 1 创建DLI通用队列 DLI控制台创建作业运行的DLI队列。 2 上传数据到OBS桶 OBS控制台将测试数据上传到OBS桶下。 3 新建Maven工程，配置pom文件 IntelliJ IDEA 参考样例代码说明，编写程序代码读取OBS数据。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

需要执行INSERT命令的表的名称。 part_spec 指定详细的分区信息。若分区字段为多个字段，需要包含所有的字段，但是可以不包含对应的值，系统会匹配上对应的分区。单表分区数最多允许100000个。 select_statement 源表上的SELECT查询（支持DLI表、OBS表）。 values_row

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关

总条数： 283

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

基本概念 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线