搜索_华为云

如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

这里的sink表通过创建临时表指向Hudi表路径来写入数据，同时在表参数中配置hive_sync相关参数，实时同步元数据至由DLI提供的元数据服务。（具体参数详见Flink参数一节）请将作业中sink表的path参数修改为希望保存hudi表的obs路径。 -- 临时表作为source，通过datagen

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

x的作业日志中提示找不到global_temp数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执行注册viewManager时，会校验该数据库在metastore是否存在，如果该数据库存在则会导致Spark作业执行失败。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？问题现象使用DLI插入数据到OBS临时表文件，数据量有差异。根因分析出现该问题可能原因如下：作业执行过程中，读取数据量错误。验证数据量的方式不正确。通常在执行插入数据操作后，如需确认插入数据量是否正确，建议通过查询语句进行查询。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
配置DLI作业桶 - 数据湖探索 DLI

在“工程配置”页面，选择“DLI作业桶”，单击配置桶信息。图1 工程配置单击打开桶列表。选择用于存放DLI作业临时数据的桶，并单击“确定”。完成设置后DLI作业运行过程中产生的临时数据将会存储在该OBS桶中。图2 设置DLI作业桶父主题：准备工作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
DLI是否支持导入其他租户共享OBS桶的数据？ - 数据湖探索 DLI

安全性和数据隔离。对于需要跨租户共享和分析数据的场景，建议先将数据脱敏后上传到OBS桶中，再进行数据分析，分析完成后及时删除OBS桶中的临时数据，以确保数据安全父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

SQL使用DEW管理访问凭据。 Flink Jar 作业使用固定AKSK访问OBS、Flink Jar 获取委托的临时AKSK、Flink SQL UDF 获取委托的临时AKSK场景。请参考Flink作业委托场景开发指导。 Flink 1.15 Jar 读取用户自定义配置文件的方式相比Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

导出结果：将作业运行结果导出至用户创建的OBS桶中。 EXPORT作业除上述操作外，还包括：立即下载归档日志：将作业日志保存到系统创建的DLI临时OBS数据桶中。说明： default队列下运行的作业或者该作业为同步作业时不支持归档日志操作。查看作业详情在“SQL作业”页面，选

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
CREATE FUNCTION语句 - 数据湖探索 DLI

TEMPORARY 创建一个有 catalog 和数据库命名空间的临时 catalog function ，并覆盖原有的 catalog function 。 TEMPORARY SYSTEM 创建一个没有数据库命名空间的临时系统 catalog function ，并覆盖系统内置的函数。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
状态码 - 数据湖探索 DLI
状态码 - 数据湖探索 DLI

状态码状态码如表1所示。表1 状态码状态码编码状态码说明 100 Continue 继续请求。这个临时响应用来通知客户端，它的部分请求已经被服务器接收，且仍未被拒绝。 101 Switching Protocols 切换协议。只能切换到更高级的协议。例如，切换到HTTP的新版本协议。

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
Flink作业委托场景开发指导 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 Flink Jar 使用DEW获取访问凭证读写OBS 获取Flink作业委托临时凭证用于访问其他云服务父主题： Flink作业开发指南

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Spark Jar作业开发指南 - 数据湖探索 DLI

使用Spark作业访问DLI元数据使用Spark作业跨源访问数据源 Spark Jar 使用DEW获取访问凭证读写OBS 获取Spark作业委托临时凭证用于访问其他云服务

 帮助中心 > 数据湖探索 DLI > 开发指南
Spark SQL语法概览 - 数据湖探索 DLI

创建OBS表时开启数据多版本修改表时开启或关闭数据多版本设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
FileSystem结果表 - 数据湖探索 DLI

ing状态的文件将首先被提交为一个以.开头的临时文件。这些临时文件随后将会按照用户指定的策略和合并方式进行合并，最终生成合并后的Pending状态的文件。然后这些文件将被发送给Committer并提交为正式文件，在这之后，原始的临时文件也会被删除掉。分区功能 Filesystem

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
对象存储OBS结果表 - 数据湖探索 DLI

ing状态的文件将首先被提交为一个以.开头的临时文件。这些临时文件随后将会按照用户指定的策略和合并方式进行合并，最终生成合并后的Pending状态的文件。然后这些文件将被发送给Committer并提交为正式文件，在这之后，原始的临时文件也会被删除掉。分区功能 Filesystem

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

示例（适用于Kafka集群已开启SASL_SSL场景）示例1：DMS集群使用SASL_SSL认证方式。创建DMS的kafka集群，开启SASL_SSL，并下载SSL证书，将下载的证书client.jks上传到OBS桶中。 CREATE TABLE ordersSource ( order_id string

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

--********************************************************************-- -- 临时中间表 --********************************************************************--

帮助中心 > 数据湖探索 DLI > 最佳实践
DLI弹性资源池与队列简介 - 数据湖探索 DLI

务场景。全局共享模式 default队列多用户多队列共享资源按量付费，不支持预留资源适合不确定数据量大小或仅需要偶尔进行数据处理的临时或测试项目场景。非弹性资源池模式（废弃，不推荐使用） SQL队列通用队列单用户单队列独享资源无法动态调整，资源可能会闲置废弃，不推荐使用

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

Table，processing-time temporal join始终会加入最新版本的时态表。Flink支持分区表和 Hive非分区表的临时连接，对于分区表，Flink 支持自动跟踪Hive表的最新分区。详情可参考：Apache Flink Hive Read & Write 注意事项

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

示例（适用于Kafka集群已开启SASL_SSL场景）示例1：DMS集群使用SASL_SSL认证方式。创建DMS的kafka集群，开启SASL_SSL，并下载SSL证书，将下载的证书client.jks上传到OBS桶中。 CREATE TABLE ordersSource ( order_id string

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表

总条数： 118

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何合并小文件 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

DLI是否支持导入其他租户共享OBS桶的数据？ - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

状态码 - 数据湖探索 DLI

Flink作业委托场景开发指导 - 数据湖探索 DLI

Spark Jar作业开发指南 - 数据湖探索 DLI

Spark SQL语法概览 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线