搜索_华为云

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业”，在对应报错作业的“操作”列，单击“编辑”进入到SQL编辑器页面。单击“设置”，在参数设置中选择“spark.sql.autoBroadcastJoinThreshold”参数，其值设置为“-1”。重新单击“执行”，运行该作业，观察作业运行结果。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

taArts Studio实例。具体操作请参考购买DataArts Studio基础包。进入DataArts Studio实例空间购买完成DataArts Studio实例后，单击“进入控制台”。图2 进入DataArts Studio实例控制台单击“空间管理”，进入数据开发页面。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？场景概述 DLI Flink作业具有高可用保障能力，通过设置“异常自动重启”功能，可在周边服务短时故障恢复后自动重启。操作步骤登录DLI控制台，选择“作业管理”>“Flink作业”。在Flink作业编辑页面，勾选“异常自动重启”。例如，图1所示。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
Python开发环境配置 - 数据湖探索 DLI

it with Build Tools for Visual Studio ”，可能是由于缺少C++编译器导致的报错，建议您根据提示信息安装相应版本的Visual Studio编译器解决。部分操作系统Visual Studio安装后需重启才可以生效。父主题： Python SDK环境配置

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
弹性资源池CU设置 - 数据湖探索 DLI

CUs，再通过变更弹性资源池规格，将规格调整至大于等于目标CUs，此时实际CUs等于规格，再通过CU设置，调整CU范围的最小值等于目标CUs。按需计费模式的弹性资源池，通过调整当前弹性资源池中队列的最大CU或增加队列，以增大弹性资源池的实际CUs，再通过CU设置，调整CU范围的最小值等于目标CUs。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

CPU核数+Executor个数*Executor CPU核数），[（driver CPU内存数+Executor个数*Executor内存）/4]} 内存数=driver内存+(Executor个数*Executor内存）表3 选择依赖资源参数说明参数名称参数描述 modules 如果选择Spark版本为3

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
设置Spark作业优先级 - 数据湖探索 DLI

设置Spark作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
设置SQL作业优先级 - 数据湖探索 DLI

设置SQL作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个SQL设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

产品规格弹性资源池产品规格弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存）。弹性资源池的单位为CU，1CU包含1CPU和4GB内存。您可以在弹性资源池中创建多个队列，队列之间的计算资源支持共享。通过合理设置队列的计算资源池分配策略，提高计算资源利用率。 DL

帮助中心 > 数据湖探索 DLI > 产品介绍
设置Flink作业优先级 - 数据湖探索 DLI

在“自定义配置”中输入如下语句，先开启动态扩缩容功能，再设置作业优先级。对于Flink作业，必须先设置flink.dli.job.scale.enable=true开启动态扩缩容功能，再设置作业优先级。开启动态扩缩容的更多参数设置请参考开启Flink作业动态扩缩容。 flink.dli

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误问题现象在DataArts Studio上运行DLI SQL脚本，执行结果的运行日志显示语句执行失败，错误信息为： DLI.0999:

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
队列属性设置 - 数据湖探索 DLI

队列属性设置操作场景 DLI支持在队列创建完成后设置队列的属性。当前支持设置队列的Spark driver的相关参数：通过设置队列的Spark driver，以提升队列资源的调度效率。本节操作介绍在管理控制台设置队列属性的操作步骤。约束与限制仅Spark引擎的SQL队列支持配置队列属性。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Spark作业使用咨询 - 数据湖探索 DLI

Spark不支持作业调度，用户可以通过其他服务，例如数据湖管理治理中心DataArts Studio服务进行调度，或者通过API/SDK等方式对作业进行自定义调度。使用DataArts Studio服务进行作业开发请参考《数据治理中心用户指南》。 Spark SQL语法创建表时是否支持定义主键

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink作业性能调优 - 数据湖探索 DLI

size=xx 使用超高IO本地盘规格机型，加速磁盘操作 group agg单点及数据倾斜调优按天聚合计算或者group by key不均衡场景下，group聚合计算存在单点或者数据倾斜问题，此时，可以通过将聚合计算拆分成Local-Global进行优化。配置方式为设置调优参数: table

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
怎样查看DLI SQL日志？ - 数据湖探索 DLI

怎样查看DLI SQL日志？场景概述日常运维时需要查看DLI SQL日志。操作步骤在DataArts Studio控制台获取DataArts Studio执行DLI作业的job id。图1 查看日志图2 查找job id 在DLI控制台，选择“作业管理”>“SQL作业”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

检查网络是否发生闪断，分析集群负载是否很高。如果频繁出现Full GC, 建议排查代码，确认是否有内存泄漏。图2 Full GC 处理步骤如果频繁Full GC, 建议排查代码，是否有内存泄漏。增加单TM所占的资源。联系技术支持，修改集群心跳配置参数。父主题： Flink作业性能调优类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？问题现象客户在数据治理中心DataArts Studio创建DLI的跨源RDS表，执行insert overwrite语句向RDS写入数据报错：DLI.0999: BatchUpdateException:

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
包年包月弹性资源池设置了定时扩缩容时，怎样计费？ - 数据湖探索 DLI

超出规格64CUs。），因此在2023/03/10 15:50:04变更弹性资源池规格为128CU。弹性资源池计费详情请参见数据湖探索价格详情。价格仅供参考，实际计算请以数据湖探索价格详情中的价格为准。该示例计费详情如表1所示。表1 包年/包月弹性资源池+扩缩容场景计费示例

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
创建弹性资源池并添加队列 - 数据湖探索 DLI

弹性资源池网段设置后不支持更改。仅支持查看30天以内的弹性资源池扩缩容历史。弹性资源池无法直接访问公网。弹性资源池关联队列弹性资源池关联队列：仅支持关联按需计费模式的队列（包括专属队列）。队列和弹性资源池状态正常，资源未被冻结。弹性资源池扩缩容弹性资源池CU设置、弹性资

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列

总条数： 510

上一页
1
2
3
4
5
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

弹性资源池CU设置 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

队列属性设置 - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

怎样查看DLI SQL日志？ - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

包年包月弹性资源池设置了定时扩缩容时，怎样计费？ - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线