搜索_华为云

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

MySQL数据源创建目的端DLI数据源的连接。登录CDM控制台，选择“集群管理”，选择已创建的CDM集群，在操作列选择“作业管理”。在作业管理界面，选择“连接管理”，单击“新建连接”，连接器类型选择“数据湖探索（DLI）”，单击“下一步”。图3 创建DLI数据源连接配置目的端DLI数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

Kafka数据源配置。配置目的端DLI的数据源连接。登录CDM控制台，选择“集群管理”，选择已创建的CDM集群，在操作列选择“作业管理”。在作业管理界面，选择“连接管理”，单击“新建连接”，连接器类型选择“数据湖探索（DLI）”，单击“下一步”。图4 创建DLI数据源连接配置目的端DLI数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
DLI的数据可存储在哪些地方 - 数据湖探索 DLI

S等。 DLI表与OBS表有什么区别？ DLI表表示数据存储在本服务内部，用户不感知数据存储路径。 OBS表表示数据存储在用户自己账户的OBS桶中，源数据文件由用户自己管理。 DLI表相较于OBS表提供了更多权限控制和缓存加速的功能，性能相较于外表性能更好，但是会收取存储费用。父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

计算配置，建议作业最大并行数为计算单元2倍为宜。勾选“保存作业日志”，选择一个OBS桶。如果该桶未授权，需要单击“立即授权”进行授权。配置该参数，可以在作业异常失败后，将作业日志保存到用户的OBS桶下，方便用户定位故障原因。图3 保存作业日志勾选“作业异常告警”，选择1中创

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 create table hudiSource ( attr_name attr_type

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
Flink作业推荐配置指导 - 数据湖探索 DLI

计算配置，建议作业最大并行数为计算单元2倍为宜。勾选“保存作业日志”，选择一个OBS桶。如果该桶未授权，需要单击“立即授权”进行授权。配置该参数，可以在作业异常失败后，将作业日志保存到用户的OBS桶下，方便用户定位故障原因。图3 保存作业日志勾选“作业异常告警”，选择1中创

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

Hive数据源配置。配置目的端DLI的数据源连接。登录CDM控制台，选择“集群管理”，选择已创建的CDM集群，在操作列选择“作业管理”。在作业管理界面，选择“连接管理”，单击“新建连接”，连接器类型选择“数据湖探索（DLI）”，单击“下一步”。图5 创建DLI数据源连接配置目的端DLI数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
FileSystem源表 - 数据湖探索 DLI
FileSystem源表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。语法格式 1 2 3 4 5 6 7 create table dataGenSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
INSERT - 数据湖探索 DLI
INSERT - 数据湖探索 DLI

into时，会往表中追加数据，而使用insert overwrite时，如果表属性“auto.purge”被设置为“true”，直接删除原表数据，再写入新的数据。如果对象表是分区表时，insert overwrite会删除对应分区的数据而非所有数据。 insert into后面的table关键字为可选，以兼容hive语法。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DML 语法
Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

cannot be null 问题根因该Flink SQL作业在配置作业运行参数时，有选择保存作业日志或开启Checkpoint，配置了OBS桶保存作业日志和Checkpoint。但是运行该Flink SQL作业的IAM用户没有OBS写入权限导致该问题。解决方案登录IAM控制

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

json_string STRING 需要解析的JSON对象，使用字符串表示。 json_path STRING 解析JSON的路径表达式，使用字符串表示。目前path支持如下表达式参考下表表3。表3 json_path参数支持的表达式表达式说明 $ 根对象 [] 数组下标 * 数组通配符 .

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 1 2 3 4 5 6 7 8 9 create table printSink ( attr_name

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

使用该功能，所有涉及OBS的桶，都需要进行配置AKSK。语法格式在Spark Jar作业编辑界面，选择配置优化参数，配置信息如下: 不同的OBS桶，使用不同的AKSK认证信息。可以使用如下配置方式，根据桶指定不同的AKSK信息，参数说明详见表1。 spark.hadoop.fs.obs

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

spark-defaults.conf 修改DLI Livy工具配置文件上传指定的DLI Livy工具jar资源包到OBS桶路径下。登录OBS控制台，在指定的OBS桶下创建一个存放Livy工具jar包的资源目录。例如：“obs://bucket/livy/jars/”。进入3.a中DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
导出查询结果 - 数据湖探索 DLI

file_format为csv时，options参数可以参考表3。注意事项通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute by rand()”，可以增加处理作业的并发量。例如：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

DLI无需数据搬迁，对多数据源进行联邦分析。数据分级存储：车企需要保留全量历史数据支撑审计类等业务，低频进行访问。温冷数据存放在低成本的对象存储服务OBS上，高频访问的热数据存放在数据引擎（CloudTable和DWS）中，降低整体存储成本。告警快速敏捷触发服务器弹性伸缩：对

 帮助中心 > 数据湖探索 DLI > 产品介绍
BlackHole结果表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 create table blackhole_table ( attr_name attr_type

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1.15 当前仅支持

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
类型转换函数 - 数据湖探索 DLI

行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource ( cast_int_to_string

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

json_string STRING 需要解析的JSON对象，使用字符串表示。 json_path STRING 解析JSON的路径表达式，使用字符串表示。目前path支持如下表达式参考下表表3。表3 json_path参数支持的表达式表达式说明 $ 根对象 [] 数组下标 * 数组通配符 .

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数

总条数： 560

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

FileSystem源表 - 数据湖探索 DLI

INSERT - 数据湖探索 DLI

Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

Print - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

BlackHole结果表 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线