搜索_华为云

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个stage运行时间超过

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操作会增加executor的内存消耗，如果executor内存不够时，导致作业运行失败。解决措施排查执行的SQL中是否有使用“/*+ BROADCAST(u) */”强制做broadcastjoin。如果有，则需要去掉该标识。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
取消批处理作业 - 数据湖探索 DLI

project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 batch_id 是 String 批处理作业的ID。具体为创建批处理作业中获取的作业ID。请求消息无请求参数。响应消息表2 响应参数参数名称是否必选参数类型说明 msg 否 String

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
查询批处理作业状态 - 数据湖探索 DLI

是批处理作业的ID。请求消息无请求参数。响应消息表2 响应参数说明参数名称是否必选参数类型说明 id 否 String 批处理作业的ID，采用UUID（通用唯一识别码）格式。 state 否 String 批处理作业的状态，请参见创建批处理作业中的表7。请求示例

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
删除经典型跨源连接 - 数据湖探索 DLI

删除经典型跨源连接功能介绍该API用于删除已创建的经典型跨源连接。创建中的连接，无法删除。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式 DELETE /v2.0/{project_id}/datasource-con

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 经典型跨源连接相关API（废弃）
删除增强型跨源连接 - 数据湖探索 DLI

删除增强型跨源连接功能介绍该API用于删除已创建的增强型跨源连接。创建中的连接，无法删除。调试您可以在API Explorer中调试该接口。 URI URI格式 DELETE /v2.0/{project_id}/datasource/enhanced-connections/{connection_id}

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1.15 当前仅支持使用Hive语法创建OBS表和使用hive语法的DLI Lakehouse表。使用Hive语法创建OBS表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
SQL作业运行慢如何定位 - 数据湖探索 DLI

参考图10可以看到数据倾斜时，单个任务的shuffle数据远大于其他Task的数据，导致该任务耗时时间变长。图10 数据倾斜示例图数据倾斜原因和解决： Shuffle的数据倾斜基本是由于join中的key值数量不均衡导致。对join连接条件进行group by 和count，统计每个连接条件的key值的数量。示例如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

TypeSerializer 序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
导入Flink作业保存点 - 数据湖探索 DLI

是 String Flink作业的作业ID。 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。请求参数表2 请求Body参数参数是否必选参数类型描述 job_id 是 Long Flink作业的ID。 savepoint_path

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业管理相关API
BlackHole结果表 - 数据湖探索 DLI

Connector允许接收所有输入记录，常用于高性能测试和UDF 输出，其不是实质性Sink。Blackhole结果表是系统内置的Connector。例如，如果您在注册其他类型的Connector结果表时报错，但您不确定是系统问题还是结果表WITH参数错误，您可以将WITH参数修改为'connector'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
检查SQL语法 - 数据湖探索 DLI
检查SQL语法 - 数据湖探索 DLI

请求参数参数名称是否必选参数类型说明 sql 是 String 待执行的SQL语句。 currentdb 否 String SQL语句执行所在的数据库。说明：在SQL里面已经包含db_name的情况下可以不选该参数，例如SQL为：select * from db1.t1。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
解绑队列 - 数据湖探索 DLI
解绑队列 - 数据湖探索 DLI

connection_id 是 String 连接ID，用于标识跨源连接的UUID。请求消息表2 请求参数参数名称是否必选参数类型说明 queues 否 Array of String 需要使用跨源的队列名列表。 elastic_resource_pools 否 Array

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
单个删除队列定时扩缩容计划（废弃） - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。 queue_name 是 String 待删除定时扩缩计划的队列名称。名称长度为1~128个字符，多个队列名称使用逗号“,”分隔。 plan_id 是 Long 待删除的队列扩缩容计划的ID。具体获取请参考查看队列定时扩缩容计划（废弃）。请求消息无请求参数。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
查询指定资源类型的标签信息 - 数据湖探索 DLI

查询指定资源类型的标签信息功能介绍该接口用于查询指定资源类型的标签信息，即指定项目中资源类型的所有资源标签集合。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET

帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

参考增强型跨源连接，在DLI上根据MySQL和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置MySQL和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据MySQL和Kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
取消作业（推荐） - 数据湖探索 DLI

取消作业（推荐）功能介绍该API用于取消已经提交的作业，若作业已经执行结束或失败则无法取消。调试您可以在API Explorer中调试该接口。 URI URI格式： DELETE /v1.0/{project_id}/jobs/{job_id} 参数说明表1 URI 参数

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
删除队列 - 数据湖探索 DLI
删除队列 - 数据湖探索 DLI

project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 queue_name 是 String 指定删除的队列名称。请求消息无请求参数。响应消息表2 响应参数参数名称是否必选参数类型说明 is_success 否 Boolean

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）

总条数： 395

上一页
1
...
15
16
17
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

取消批处理作业 - 数据湖探索 DLI

查询批处理作业状态 - 数据湖探索 DLI

删除经典型跨源连接 - 数据湖探索 DLI

删除增强型跨源连接 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

导入Flink作业保存点 - 数据湖探索 DLI

BlackHole结果表 - 数据湖探索 DLI

检查SQL语法 - 数据湖探索 DLI

解绑队列 - 数据湖探索 DLI

单个删除队列定时扩缩容计划（废弃） - 数据湖探索 DLI

查询指定资源类型的标签信息 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

取消作业（推荐） - 数据湖探索 DLI

删除队列 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线