搜索_华为云

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中问题现象 SQL作业中存在join操作，作业提交后状态一直是运行中，没有结果返回。问题根因 Spark SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

入方向规则：检查本安全组内的入方向网段及端口是否已开放，若没有则添加。检查网段及端口是否配置。图2 检查网段及端口是否配置如果不存在，则进行添加。图3 添加入方向规则出方向规则：检查出方向规则网段及端口是否开放（建议所有网段开放）。检查网段及端口是否配置。图4 检查网段及端口是否配置。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
配置SQL防御规则 - 数据湖探索 DLI

的问题，例如SQL输入语句质量良莠不齐、SQL问题难定位、大SQL语句消耗资源过多等。低质量的SQL会对数据分析平台系统带来不可预料的冲击，影响系统的性能或者平台稳定性。 DLI在Spark SQL引擎中增加SQL防御能力，基于用户可理解的SQL防御策略，实现对典型大SQL、低

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
权限管理概述 - 数据湖探索 DLI

用户行为分析，辅助决策。如图1所示，“基础平台组组长”在华为云上申请了一个“租户管理员”（Tenant Administrator）账号，用于管理和使用华为云的各个服务。因为“大数据平台组”需要使用DLI进行数据分析，所有“基础平台组组长”增加了一个权限为“DLI服务管理员”（DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

游戏公司不同部门日常通过游戏数据分析平台，分析每日新增日志获取所需指标，通过数据来辅助决策。例如：运营部门通过平台获取新增玩家、活跃玩家、留存率、流失率、付费率等，了解游戏当前状态及后续响应活动措施；投放部门通过平台获取新增玩家、活跃玩家的渠道来源，来决定下一周期重点投放哪些平台。优势高效的S

帮助中心 > 数据湖探索 DLI > 产品介绍
管理Spark作业模板 - 数据湖探索 DLI

操作场景在创建Spark作业时，您可以在已有的Spark样例模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。当前云平台尚未提供预置的Spark模板，但支持用户自定义Spark作业模板，本节操作介绍在Spark管理页面创建Spark模板的操作方法。新建Spark作业模板

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
EXPLAIN - 数据湖探索 DLI
EXPLAIN - 数据湖探索 DLI

Fragment会在固定数量的节点上执行，片段在固定数量的节点上执行，输入数据以轮循方式进行分布。 BROADCAST Fragment会在固定数量的节点上执行，输入数据被广播到所有的节点。 SOURCE Fragment在访问输入分段的节点上执行。示例 LOGICAL： CREATE TABLE testTable

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

使用DLI分析电商实时业务数据应用场景当前线上购物无疑是最火热的购物方式，而电商平台则又可以以多种方式接入，例如通过web方式访问、通过app的方式访问、通过微信小程序的方式访问等等。而电商平台则需要每天统计各平台的实时访问数据量、订单数、访问人数等等指标，从而能在显示大屏上实时展示相关

 帮助中心 > 数据湖探索 DLI > 最佳实践
DLI内置依赖包 - 数据湖探索 DLI

DLI内置依赖包 DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。 Spark 3.1.1 依赖包表1 Spark 3.1.1 依赖包依赖包名称 accessors-smart-1

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
SQL作业开发类 - 数据湖探索 DLI

怎样查看DLI SQL日志？怎样查看DLI的执行SQL记录？执行SQL作业时产生数据倾斜怎么办？ SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中为什么SQL作业一直处于“提交中”？父主题： SQL作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类
配额管理 - 数据湖探索 DLI
配额管理 - 数据湖探索 DLI

配额管理什么是配额？为防止资源滥用，平台限定了各服务资源的配额，对用户的资源数量和容量做了限制。如果当前资源配额限制无法满足使用需要，您可以申请扩大配额。怎样查看我的配额登录管理控制台。单击管理控制台左上角的，选择区域和项目。在页面右上角，选择“资源 > 我的配额”。

帮助中心 > 数据湖探索 DLI > 产品介绍
DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

检查客户安全组是否放通，安全组放通规则如下所示。入方向规则：检查本安全组内的入方向网段及端口是否已开放，若没有则添加。出方向规则：检查出方向规则网段及端口是否开放（建议所有网段开放）。客户安全组入方向和出方向配置的都是DLI队列的子网。建议客户将入方向源地址配成0.0.0.0

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

用户Flink程序的依赖包与DLI Flink平台的内置依赖包冲突，导致提交失败。解决方案首先您需要排除是否有冲突的Jar包。含DLI Flink提供了一系列预装在DLI服务中的依赖包，用于支持各种数据处理和分析任务。如果您上传的Jar包中包含DLI Flink运行平台中已经存在的包，则会提示Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

Apache Hive 已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样它也是一个数据管理平台，可用于发现，定义，和演化数据。 Flink与Hive的集成包含两个层面，一是利用了Hive的MetaStore作为持久化的Catalog

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

Flink有什么区别？ DLI Flink是天然的云原生基础架构。在内核引擎上DLI Flink进行了多处核心功能的优化，并且提供了企业级的一站式开发平台，自带开发和运维功能，免除自建集群运维的麻烦；在connector方面除了支持开源connector之外，还可以对接云上Mysql、GaussDB、MRS

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
SQL作业运行慢如何定位 - 数据湖探索 DLI

(select input_file_name() as fn from 表名) a 如果小文件过多，则可以参考如何合并小文件来进行处理。原因2 广播表：广播也可能会造成Driver内存的FullGC。登录DLI控制台，单击“作业管理 > SQL作业”。在SQL作业页面，在对应作业所在行

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

15版本的Jar作业开发指导请参考Flink Jar写入数据到OBS开发指南。配置文件使用方法方案一：直接在main函数里面加载文件内容到内存，然后广播到各个taskmanager，这种方式适合那种需要提前加载的少量变量。方案二：在open里面初始化算子的时候加载文件，可以使用相对路径/绝对路径的方式

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
什么是用户配额？ - 数据湖探索 DLI

什么是用户配额？配额是指云平台预先设定的资源使用限制，包括资源数量和容量等。设置配额是为了确保资源合理的分配和使用，避免资源过度集中和资源浪费。如果资源配额限制满足不了用户的使用需求，可以通过工单系统来提交您的申请，并告知您申请提高配额的理由。在通过审理之后，系统会更新您的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI资源配额类
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业操作场景华为云数据治理中心DataArts Studio提供了一站式数据治理平台，可以实现与DLI服务的对接，从而提供统一的数据集成、数据开发服务，方便企业对全部数据进行管控。本节操作介绍在DataArts Studio开发DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DWS Connector概述 - 数据湖探索 DLI

DWS Connector概述数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DLI将Flink作业从数据仓库服务（DWS）中读取数据。DWS数据库内核兼容PostgreSQ

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS

总条数： 57

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

EXPLAIN - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

SQL作业开发类 - 数据湖探索 DLI

配额管理 - 数据湖探索 DLI

DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

什么是用户配额？ - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线