搜索_华为云

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中问题现象 SQL作业中存在join操作，作业提交后状态一直是运行中，没有结果返回。问题根因 Spark SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操作会增加executor的内存消耗，如

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
SQL作业运行慢如何定位 - 数据湖探索 DLI

stNestedLoopJoin节点。图8 作业的DAG图。如果存在广播，则参考SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中处理。可能原因2：数据倾斜判断当前作业运行慢是否是数据倾斜导致：登录DLI控制台，单击“作业管理 > SQL作业”。在

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

产品规格弹性资源池产品规格弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存）。弹性资源池的单位为CU，1CU包含1CPU和4GB内存。您可以在弹性资源池中创建多个队列，队列之间的计算资源支持共享。通过合理设置队列的计算资源池分配策略，提高计算资源利用率。 DL

帮助中心 > 数据湖探索 DLI > 产品介绍
使用CES监控DLI服务 - 数据湖探索 DLI

0~100 队列 5分钟 queue_mem_usage 队列内存使用率展示用户队列的内存使用率。该指标仅适用于普通队列。 0~100 队列 5分钟 queue_mem_used 队列内存使用量展示用户队列的内存使用量。该指标仅适用于普通队列。 ≥0 队列 5分钟 fli

帮助中心 > 数据湖探索 DLI > 用户指南
Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

检查网络是否发生闪断，分析集群负载是否很高。如果频繁出现Full GC, 建议排查代码，确认是否有内存泄漏。图2 Full GC 处理步骤如果频繁Full GC, 建议排查代码，是否有内存泄漏。增加单TM所占的资源。联系技术支持，修改集群心跳配置参数。父主题： Flink作业性能调优类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ Spark jar 作业一直处于“提交中”可能是队列剩余的CU量不足导致作业无法提交。查看队列的的剩余步骤如下：查看队列CU使用量。点击“云监控服务 > 云服务监控 > 数据探索湖 > 队列监控 > 队列CU使用量” 。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
为什么SQL作业一直处于“提交中”？ - 数据湖探索 DLI

为什么SQL作业一直处于“提交中”？ SQL作业一直在提交中，有以下几种可能：刚购买DLI队列后，第一次进行SQL作业的提交。需要等待5~10分钟，待后台拉起集群后，即可提交成功。若刚刚对队列进行网段修改，立即进行SQL作业的提交。需要等待5~10分钟，待后台重建集群后，即可提交功。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ Flink JobManager提示 "Timeout expired while fetching topic metadata" ，说

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在创建的新数据源配置界面中，输入Kyuubi服务器的相关信息。数据库名称：本例输入DLI数据库名称。服务器地址：输入Kyuubi服务器的弹性公网IP地址。端口号：Kyuubi服务监听的端口，使用Hive Thrift协议，默认端口10009。用户名和密码：按需配置Kyuubi服务器用户名和密码。按需配置其他高级选项，然后保存配置。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

弹性资源池和队列使用DLI提交作业前，您需要为提交作业准备所需的计算资源。 · 弹性资源池和队列：弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），灵活应对业务对计算资源变化的需求。同一弹性资源池中，队列之间的计算资源支持共享。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率。

帮助中心 > 数据湖探索 DLI > 功能总览
Elasticsearch结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch中。Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

息。表7 计算资源规格参数说明参数名称参数描述资源规格下拉选择所需的资源规格。系统提供3种资源规格供您选择。资源规格包含以下参数： Executor内存 Executor CPU核数 Executor个数 driver CPU核数 driver内存最终配置结果以修改后数据为准。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

准备一个linux弹性云服务器ECS，用于安装DLI Livy。 ECS需要放通30000至32767端口、8998端口。具体操作请参考添加安全组规则。 ECS需安装Java JDK，JDK版本建议为1.8。配置Java环境变量JAVA_HOME。查询弹性云服务器ECS详细信息，获取ECS的“私有IP地址”。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch 引擎的索引中。 Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Hudi数据表Compaction规范 - 数据湖探索 DLI

提交Spark jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计规范以及实际流量的波动结合考虑，建议Compaction作业CPU与内存的比例按照1:4~1:8

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
数据湖探索简介 - 数据湖探索 DLI

用户不需要管理任何服务器，即开即用。 DLI支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。

帮助中心 > 数据湖探索 DLI > 产品介绍
DLI创建跨源连接，绑定队列一直在创建中怎么办？ - 数据湖探索 DLI

DLI创建跨源连接，绑定队列一直在创建中怎么办？跨源连接创建慢，有以下几种可能：购买DLI队列后，第一次进行绑定队列。通常需要等待5~10分钟，待后台拉起集群后，即可创建成功。若刚刚对队列进行网段修改，立即进行绑定队列。通常需要等待5~10分钟，待后台重建集群后，即可创建成功。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
SQL作业开发类 - 数据湖探索 DLI

怎样查看DLI的执行SQL记录？执行SQL作业时产生数据倾斜怎么办？ SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中为什么SQL作业一直处于“提交中”？父主题： SQL作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在创建的新数据源配置界面中，输入Kyuubi服务器的相关信息。数据库名称：本例输入DLI数据库名称。服务器地址：输入Kyuubi服务器的弹性公网IP地址。端口号：Kyuubi服务监听的端口，使用Hive Thirft协议，默认端口10009。用户名和密码：按需配置Kyuubi服务器用户名和密码。按需配置其他高级选项，然后保存配置。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读

总条数： 280

上一页
1
2
3
4
5
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

使用CES监控DLI服务 - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

为什么SQL作业一直处于“提交中”？ - 数据湖探索 DLI

Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

DLI创建跨源连接，绑定队列一直在创建中怎么办？ - 数据湖探索 DLI

SQL作业开发类 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线