搜索_华为云

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中问题现象 SQL作业中存在join操作，作业提交后状态一直是运行中，没有结果返回。问题根因 Spark SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操作会增加executor的内存消耗，如

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

[（ driver内存÷4）， driver CPU核数] x1 Spark作业未开启高级配置时默认按A类型资源规格配置。 Spark作业中显示计算资源规格的单位为CPU单位，1CU包含1CPU和4GB内存。上述公式中x1代表CPU单位转换为CU单位。请分别使用内存和CPU核数计算

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

运行spark作业依赖的jar包。表4 计算资源规格参数说明参数名称参数描述资源规格下拉选择所需的资源规格。系统提供3种资源规格供您选择。资源规格包含以下参数： Executor内存 Executor CPU核数 Executor个数 driver CPU核数 driver内存最终配置结果以修改后数据为准。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在创建的新数据源配置界面中，输入Kyuubi服务器的相关信息。数据库名称：本例输入DLI数据库名称。服务器地址：输入Kyuubi服务器的弹性公网IP地址。端口号：Kyuubi服务监听的端口，使用Hive Thrift协议，默认端口10009。用户名和密码：按需配置Kyuubi服务器用户名和密码。按需配置其他高级选项，然后保存配置。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

检查网络是否发生闪断，分析集群负载是否很高。如果频繁出现Full GC, 建议排查代码，确认是否有内存泄漏。图2 Full GC 处理步骤如果频繁Full GC, 建议排查代码，是否有内存泄漏。增加单TM所占的资源。联系技术支持，修改集群心跳配置参数。父主题： Flink作业性能调优类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
使用CES监控DLI服务 - 数据湖探索 DLI

0~100 队列 5分钟 queue_mem_usage 队列内存使用率展示用户队列的内存使用率。该指标仅适用于普通队列。 0~100 队列 5分钟 queue_mem_used 队列内存使用量展示用户队列的内存使用量。该指标仅适用于普通队列。 ≥0 队列 5分钟 fli

帮助中心 > 数据湖探索 DLI > 用户指南
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

弹性资源池和队列使用DLI提交作业前，您需要为提交作业准备所需的计算资源。 · 弹性资源池和队列：弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），灵活应对业务对计算资源变化的需求。同一弹性资源池中，队列之间的计算资源支持共享。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率。

帮助中心 > 数据湖探索 DLI > 功能总览
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

collect kyuubi会预加载select结果数据到缓存加快读取数据，数据量较大的场景防止内存OOM建议关闭。否 false 配置为false代表关闭预加载。 kyuubi.engine.jdbc.memory jdbc engine进程内存默认为1g，建议改成5g以上加大jdbc

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在创建的新数据源配置界面中，输入Kyuubi服务器的相关信息。数据库名称：本例输入DLI数据库名称。服务器地址：输入Kyuubi服务器的弹性公网IP地址。端口号：Kyuubi服务监听的端口，使用Hive Thirft协议，默认端口10009。用户名和密码：按需配置Kyuubi服务器用户名和密码。按需配置其他高级选项，然后保存配置。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
数据湖探索简介 - 数据湖探索 DLI

用户不需要管理任何服务器，即开即用。 DLI支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。

帮助中心 > 数据湖探索 DLI > 产品介绍
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

准备一个linux弹性云服务器ECS，用于安装DLI Livy。 ECS需要放通30000至32767端口、8998端口。具体操作请参考添加安全组规则。 ECS需安装Java JDK，JDK版本建议为1.8。配置Java环境变量JAVA_HOME。查询弹性云服务器ECS详细信息，获取ECS的“私有IP地址”。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
Elasticsearch结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch中。Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

对象存储服务OBS上，高频访问的热数据存放在数据引擎（CloudTable和DWS）中，降低整体存储成本。告警快速敏捷触发服务器弹性伸缩：对CPU、内存、硬盘空间和带宽无特殊要求。建议搭配以下服务使用 DIS、CDM、OBS、DWS、RDS、CloudTable 图2 车企数字化服务转型

 帮助中心 > 数据湖探索 DLI > 产品介绍
Hudi表索引设计规范 - 数据湖探索 DLI

数据读写占用的内存空间都是原始数据大小（包括空值也是会占用内存的），2GB在大数据计算过程中，处于单task读写可接受范围之内。如果是单个Bucket的数据量超过了该值范围，可能会有什么影响？读写任务可能会出现OOM的问题，解决方法就是提升单个task的内存占比。读写性

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

产品规格弹性资源池产品规格弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存）。弹性资源池的单位为CU，1CU包含1CPU和4GB内存。您可以在弹性资源池中创建多个队列，队列之间的计算资源支持共享。通过合理设置队列的计算资源池分配策略，提高计算资源利用率。 DL

帮助中心 > 数据湖探索 DLI > 产品介绍
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

ey-Value等多种数据结构的存储系统。可用于缓存、事件发布或订阅、高速队列等场景，提供字符串、哈希、列表、队列、集合结构直接存取，基于内存，可持久化。有关Redis的详细信息，请访问Redis官方网站https://redis.io/。前提条件 DLI要建立与Redis的增

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
创建DLI表关联RDS - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行overwrit

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch 引擎的索引中。 Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
创建DLI表关联DWS - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行overwrit

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读

总条数： 236

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

使用CES监控DLI服务 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

概述 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线