搜索_华为云

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移MRS Kafka数据至DLI。前提条件已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI队列时队列类型需要选择为“SQL队列”。已创建包含Kafka组件的MRS

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

Raw Format 功能描述 Raw format 允许读写原始（基于字节）值作为单个列。注意: 这种格式将 null 值编码成 byte[] 类型的 null。这样在 upsert-kafka 中使用时可能会有限制，因为 upsert-kafka 将 null 值视为墓碑消息

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项，

帮助中心 > 数据湖探索 DLI > 最佳实践
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移MRS Hive数据至DLI。其他MRS Hadoop组件数据，均可以通过CDM与DLI进行双向同步。前提条件已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI队列时队列类型需要选择为

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没有包含分区字段

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中问题现象 SQL作业中存在join操作，作业提交后状态一直是运行中，没有结果返回。问题根因 Spark SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操作会增加

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 Beeline是数据分析师和数据工程师的重要工具之一，适用于大规模数据处理的场景。Beeline提供了的SQL引擎，使得用户可以使用SQL的语言来执行数据查询、数据分析和管理任务。 Kyuubi是一个分布式 SQL 查询引擎

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Spark 3.3.1版本说明 - 数据湖探索 DLI

Spark 3.3.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.3.1版本所做的变更说明。更多Spark 3.3.1版本说明请参考Spark Release Notes。 Spark 3.3.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，性能较好

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
取消批处理作业 - 数据湖探索 DLI

取消批处理作业功能介绍该API用于取消批处理作业。作业状态为“已成功”或者“已失败”的批处理作业无法取消。调试您可以在API Explorer中调试该接口。 URI URI格式： DELETE /v2.0/{project_id}/batches/{batch_id} 参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 Fine BI是一款智能可视化工具，专注于数据分析和可视化。它支持连接多种数据源，能够将复杂的数据转换为直观的图表和仪表板，快速获得数据洞察。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
查询批处理作业状态 - 数据湖探索 DLI

查询批处理作业状态功能介绍该API用于查询批处理作业的状态。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v2.0/{project_id}/batches/{batch_id}/state 参数说明表1 URI参数参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
取消作业（推荐） - 数据湖探索 DLI

取消作业（推荐）功能介绍该API用于取消已经提交的作业，若作业已经执行结束或失败则无法取消。调试您可以在API Explorer中调试该接口。 URI URI格式： DELETE /v1.0/{project_id}/jobs/{job_id} 参数说明表1 URI 参数

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
删除队列 - 数据湖探索 DLI
删除队列 - 数据湖探索 DLI

删除队列功能介绍该API用于删除指定队列。若指定队列正在执行任务，则不允许删除。调试您可以在API Explorer中调试该接口。 URI URI格式： DELETE /v1.0/{project_id}/queues/{queue_name} 参数说明表1 URI参数

 帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
删除经典型跨源连接 - 数据湖探索 DLI

删除经典型跨源连接功能介绍该API用于删除已创建的经典型跨源连接。创建中的连接，无法删除。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式 DELETE /v2.0/{project_id}/datasource-connection

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 经典型跨源连接相关API（废弃）
删除增强型跨源连接 - 数据湖探索 DLI

删除增强型跨源连接功能介绍该API用于删除已创建的增强型跨源连接。创建中的连接，无法删除。调试您可以在API Explorer中调试该接口。 URI URI格式 DELETE /v2.0/{project_id}/datasource/enhanced-connections

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误问题现象在DataArts Studio上运行DLI SQL脚本，执行结果的运行日志显示语句执行失败，错误信息为： DLI.0999

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
查询指定地址连通性测试详情 - 数据湖探索 DLI

查询指定地址连通性测试详情功能介绍该API用于在连通性测试提交后查询连通性结果。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v1.0/{project_id}/queues/{queue_name}/connection-test/{

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

DLI Hudi元数据 DLI Hudi元数据说明创建Hudi表时会在元数据仓创建表的相关元数据信息。 Hudi支持对接DLI元数据和Lakeformation元数据（仅Spark 3.3.1及以上版本支持对接Lakeformation元数据），对接方式与Spark一致。 DLI

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考

总条数： 227

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

取消批处理作业 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

查询批处理作业状态 - 数据湖探索 DLI

取消作业（推荐） - 数据湖探索 DLI

删除队列 - 数据湖探索 DLI

删除经典型跨源连接 - 数据湖探索 DLI

删除增强型跨源连接 - 数据湖探索 DLI

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

查询指定地址连通性测试详情 - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线