搜索_华为云

查询作业结果-方式二（废弃） - 数据湖探索 DLI

查询作业结果-方式二（废弃）功能介绍该API用于在执行SQL查询语句的作业完成后，查看该作业执行的结果。目前仅支持查看“QUERY”类型作业的执行结果。该API只能查看前1000条的结果记录，若要查看全部的结果记录，需要先导出查询结果再进行查看，详细请参见导出查询结果。当前接口已废弃，不推荐使用。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
DLI经典型跨源连接下线（EOL）公告 - 数据湖探索 DLI

DLI经典型跨源连接下线（EOL）公告公告说明华为云计划于2024年06月30 00:00（北京时间）将DLI经典型跨源连接的相关功能下线（EOL）。影响 DLI经典型跨源连接的相关功能下线（EOL）后，不再提供该功能任何技术服务与支持。如果您正在使用DLI经典型跨源连接

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
程序包管理概述 - 数据湖探索 DLI

程序包管理概述在执行DLI作业前需要将UDF Jar包或Jar作业程序包上传到云平台进行统一的管理和维护。有以下两种方式管理程序包：（推荐使用）上传至OBS管理程序包：提前将对应的jar包上传至OBS桶中，在作业配置时选择对应的OBS路径。（DLI程序包功能即将停用）上传

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池操作场景如果其他弹性资源池想要通过已创建的增强型跨源连接来连接数据源，可以在增强型跨源连接页面绑定弹性资源池。本节的操作指导介绍增强型跨源连接绑定弹性资源池的操作指导。约束限制增强型跨源仅支持包年包月队列和按需专属的弹性资源池/队列。绑定跨源的DLI队列网段和数据源网段不能重合。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

Debezium Format 功能描述 Debezium是一个 CDC（Changelog Data Capture，变更数据捕获）的工具，可以把来自 MySQL、PostgreSQL、Oracle、Microsoft SQL Server 和许多其他数据库的更改实时流式传输到

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
了解数据目录、数据库和表 - 数据湖探索 DLI

了解数据目录、数据库和表数据库和表是SQL作业、Spark作业场景开发的基础，在执行作业前您需要根据业务场景定义数据库和表。 Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

Raw Format 功能描述 Raw format 允许读写原始（基于字节）值作为单个列。注意: 这种格式将 null 值编码成 byte[] 类型的 null。这样在 upsert-kafka 中使用时可能会有限制，因为 upsert-kafka 将 null 值视为墓碑

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项

 帮助中心 > 数据湖探索 DLI > 最佳实践
队列标签管理 - 数据湖探索 DLI

队列标签管理标签管理标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。 DLI支持以下两类标签：资源标签：在DLI中创建的非全局的标签。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
查询所有SQL样例模板（废弃） - 数据湖探索 DLI

查询所有SQL样例模板（废弃）功能介绍该API用于查询所有SQL样例模板。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v1.0/{project_id}/sqls/sample 参数说明表1 URI参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 模板相关API（废弃）
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
增强型跨源连接标签管理 - 数据湖探索 DLI

增强型跨源连接标签管理操作场景标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。如您的组织已经设定DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
弹性资源池标签管理 - 数据湖探索 DLI

弹性资源池标签管理标签管理标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。 DLI支持以下两类标签：资源标签：在DLI中创建的非全局的标签。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Flink Jar作业开发基础样例 - 数据湖探索 DLI

Flink Jar作业开发基础样例概述用户可以基于Flink的API进行二次开发，构建自己的应用Jar包，提交到DLI队列运行，实现与MRS Kafka、HBase、Hive、HDFS，DWS，DCS等数据源的交互。本章节以通过自定义作业与MRS进行交互为例进行说明。更多样例代码请通过DLI样例代码获取。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中问题现象 SQL作业中存在join操作，作业提交后状态一直是运行中，没有结果返回。问题根因 Spark SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
创建批处理作业 - 数据湖探索 DLI

创建批处理作业功能介绍该API用于在某个队列上创建批处理作业。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v2.0/{project_id}/batches 参数说明表1 URI参数参数名称是否必选参数类型说明 project_id

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
取消批处理作业 - 数据湖探索 DLI

取消批处理作业功能介绍该API用于取消批处理作业。作业状态为“已成功”或者“已失败”的批处理作业无法取消。调试您可以在API Explorer中调试该接口。 URI URI格式： DELETE /v2.0/{project_id}/batches/{batch_id} 参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口

总条数： 429

上一页
1
...
15
16
17
...
22
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询作业结果-方式二（废弃） - 数据湖探索 DLI

DLI经典型跨源连接下线（EOL）公告 - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

队列标签管理 - 数据湖探索 DLI

查询所有SQL样例模板（废弃） - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

弹性资源池标签管理 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

取消批处理作业 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线