搜索_华为云

数据湖探索简介 - 数据湖探索 DLI

数据湖探索简介什么是数据湖探索数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、HetuEngine生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。

帮助中心 > 数据湖探索 DLI > 产品介绍
Hudi常见配置参数 - 数据湖探索 DLI

Hudi常见配置参数本章节介绍Hudi重要配置的详细信息，更多配置请参考hudi官网：https://hudi.apache.org/cn/docs/0.11.0/configurations/。提交DLI Spark SQL作业时，在SQL编辑器界面右上角的”设置”->”参数设置”中可以配置Hudi参数。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

'connector' = 'print' ); insert into ordersSink select * from ordersSource; 常见问题 Flink作业运行失败，作业运行日志中如下报错信息，应该怎么解决？ org.apache.kafka.common.errors.TimeoutException:

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

show() 查询结果： DataFrame相关操作 createDataFrame() 方法创建的数据和read.format() 方法及read.jdbc() 方法查询的数据都为DataFrame对象，可以直接进行查询单条记录等操作（在“通过DataFrame API访问数据

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

show() 查询结果： DataFrame相关操作 createDataFrame() 方法创建的数据和read.format() 方法及read.jdbc() 方法查询的数据都为DataFrame对象，可以直接进行查询单条记录等操作（在“步骤4”中，提到将DataFrame数据注册为临时表）。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

Ogg Format 功能描述 Oracle GoldenGate (a.k.a ogg) 是一个实现异构 IT 环境间数据实时数据集成和复制的综合软件包。该产品集支持高可用性解决方案、实时数据集成、事务更改数据捕获、运营和分析企业系统之间的数据复制、转换和验证。Ogg 为变更日志提供了统一的格式结构，并支持使用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Json函数和运算符 - 数据湖探索 DLI

Json函数和运算符 Cast to JSON SELECT CAST(9223372036854775807 AS JSON); -- JSON '9223372036854775807' Cast from JSON SELECT CAST(JSON '[1,23,456]'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

区connector基础之上，新增了Redis、DWS(GaussDB)数据源类型。社区Flink SQL DDL/DML/函数等语法说明及限制可参考Table API & SQL。 Flink OpenSource SQL1.15语法请参考Flink OpenSource SQL1

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

阅读并同意隐私协议，单击“确定”。提交作业，页面显示“作业提交成功”。（可选）可到“作业管理”>“Spark作业”页面查看提交作业的状态及日志。在DLI管理控制台第一次单击“执行”操作时，需要阅读隐私协议，同意确定后，后续操作将不会再提示。后续指引完成Spark Jar作

 帮助中心 > 数据湖探索 DLI > 快速入门
提交SQL作业（推荐） - 数据湖探索 DLI

IMPORT EXPORT QUERY INSERT schema 否 Array of Map 当语句类型为DDL时，返回其结果的列名称及类型。 rows 否 Array of objects 当语句类型为DDL，且dli.sql.sqlasync.enabled=false时

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

Debezium Format 功能描述 Debezium是一个 CDC（Changelog Data Capture，变更数据捕获）的工具，可以把来自 MySQL、PostgreSQL、Oracle、Microsoft SQL Server 和许多其他数据库的更改实时流式传输到

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建增强型跨源连接 - 数据湖探索 DLI

检测跨源连接的连通性时对域名约束限制如下：域名的限制长度为1到255的字符串，并且组成必须是字母、数字、下划线或者短横线。域名的顶级域名至少包含两个及以上的字母，例如.com，.net，.cn等。测试时域名后可选择添加端口，用":"隔开，端口最大限制为5位，端口范围：0~65535。例如example

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
使用Hive语法创建OBS表 - 数据湖探索 DLI

RTITIONED BY关键字后指定，不能像普通字段一样在表名后指定，否则将出错。单表分区数最多允许200000个。 Spark 3.3及以上版本支持使用Hive语法的CTAS语句创建分区表。关于创建表时设置多字符的分隔符：只有指定ROW FORMAT SERDE为org.apache

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

MS Kafka实例连接地址并创建DMS Topic。步骤3：创建RDS数据库表。获取RDS实例内网地址，登录RDS实例创建RDS数据库及MySQL表。步骤4：创建DLI增强型跨源。创建DLI增强型跨源，并测试队列与RDS、DMS实例连通性。步骤5：创建并提交Flink作业。创建DLI

帮助中心 > 数据湖探索 DLI > 最佳实践
使用Hive语法创建DLI表 - 数据湖探索 DLI

RTITIONED BY关键字后指定，不能像普通字段一样在表名后指定，否则将出错。单表分区数最多允许200000个。 Spark 3.3及以上版本支持使用Hive语法的CTAS语句创建分区表。语法格式 1 2 3 4 5 6 7 8 9 10 11 12 13

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

使用DLI提交Flink Jar作业操作场景 Flink Jar作业适用于需要自定义流处理逻辑、复杂的状态管理或特定库集成的数据分析场景。需要用户自行编写并构建Jar作业程序包，在提交Flink Jar作业前，将Jar作业程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。

帮助中心 > 数据湖探索 DLI > 快速入门
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

近似估算的方式使用的内存更少。capacity值越大，结果越精确，但消耗的内存也更多。该函数的返回结果是一个map，map的键值对为高频值及对应的频次。 SELECT approx_most_frequent(3, x, 15) FROM (values 'A', 'B', 'A'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
日期、时间函数及运算符 - 数据湖探索 DLI

日期、时间函数及运算符日期时间运算符运算符示例结果 + date '2012-08-08' + interval '2' day 2012-08-10 + time '01:00' + interval '3' hour 04:00:00.000 + timestamp '2012-08-08

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

rMetadata-1.0-SNAPSHOT.jar”。图10 导出jar包步骤6：上传Jar包到OBS和DLI下 Spark 3.3及以上版本：仅支持在创建Spark作业时，配置“应用程序”，从OBS选择作业所需的Jar包。登录OBS控制台，将生成的Jar包文件上传到OBS路径下。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

南》中“安全组”章节。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表

总条数： 520

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据湖探索简介 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

日期、时间函数及运算符 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线