搜索_华为云

创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

创建SQL作业的API执行超过时间限制，运行超时报错问题现象 DLI上调用“提交SQL作业”API运行超时，报如下错误信息： There are currently no resources tracked in the state, so there is nothing to

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误问题现象在DataArts Studio上运行DLI SQL脚本，执行结果的运行日志显示语句执行失败，错误信息为： DLI.0999: RuntimeException:

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
怎样查看DLI的执行SQL记录？ - 数据湖探索 DLI

怎样查看DLI的执行SQL记录？场景概述执行SQL作业过程中需要查看对应的记录。操作步骤登录DLI管理控制台。在左侧导航栏单击“作业管理”>“SQL作业”进入SQL作业管理页面。输入作业ID或者执行的语句可以筛选所要查看的作业。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范写作业未停止情况下，禁止手动执行run schedule命令生成compaction计划。错误示例： run schedule on dsrTable 如果还有别的任务在写这张表，执行该操作会导致数据丢失。执行run com

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查询作业执行计划 - 数据湖探索 DLI

查询作业执行计划功能介绍该API用于查询作业执行计划。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{project_id}/streaming/jobs/{job_id}/execute-graph 参数说明表1 URI参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
设置SQL作业优先级 - 数据湖探索 DLI

设置SQL作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个SQL设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
SQL作业执行完成后，修改表名导致datasize不正确怎么办？ - 数据湖探索 DLI

SQL作业执行完成后，修改表名导致datasize不正确怎么办？在执行SQL作业后立即修改表名，可能会导致表的数据大小结果不正确。这是因为DLI在执行SQL作业时，会对表进行元数据更新，如果在作业执行完成前修改了表名，会和作业的元数据更新过程冲突，从而影响对数据大小的判断。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
执行查询语句报错：There should be at least one partition pruning predicate on partitioned table XX.YYY - 数据湖探索 DLI

YYY执行查询时，其查询条件中未使用其表分区列。查询分区表时，查询条件中每个分区表必须包含至少一个分区列才允许执行，否则不允许执行。解决方案建议用户参考如下例子查询分区表：其中partitionedTable为分区表，partitionedColumn为分区列，查询语句为： SELECT * FROM partitionedTable

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
执行SQL查询语句报错：DLI.0003: Permission denied for resource.... - 数据湖探索 DLI

执行SQL查询语句报错：DLI.0003: Permission denied for resource.... 问题现象执行SQL查询语句，提示没有对应资源查询权限。报错信息：DLI.0003: Permission denied for resource 'databases

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 - 数据湖探索 DLI

SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据问题现象客户创建Flink SQL作业，消费Kafka后sink到es集群，作业执行成功，但无数据。原因分析查看客户作业脚本内容，排查无问题，作业执行成功，出现该问题可能的原因如下：数据不准确。数据处理有问题。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
查询作业执行进度信息 - 数据湖探索 DLI

查询作业执行进度信息功能介绍该API用于获取作业执行进度信息，如果作业正在执行，可以获取到子作业的信息，如果作业刚开始或者已经结束，则无法获取到子作业信息。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v1/{project_id}/

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
离线Compaction配置 - 数据湖探索 DLI

离线Compaction配置对于MOR表的实时业务，通常设置在写入中同步生成compaction计划，因此需要额外通过DataArts或者脚本调度SparkSQL去执行已经产生的compaction计划。执行参数 set hoodie.compact.inline = true;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
设置Spark作业优先级 - 数据湖探索 DLI

设置Spark作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
配置Hudi数据列默认值 - 数据湖探索 DLI

配置Hudi数据列默认值该特性允许用户在给表新增列时，设置列的默认值。查询历史数据时新增列返回默认值。使用约束新增列在设置默认值前，如果数据已经进行了重写，则查询历史数据不支持返回列的默认值，返回NULL。数据入库、更新、执行Compaction、Clustering都会导致部分或全部数据重写。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
设置Flink作业优先级 - 数据湖探索 DLI

在“自定义配置”中输入如下语句，先开启动态扩缩容功能，再设置作业优先级。对于Flink作业，必须先设置flink.dli.job.scale.enable=true开启动态扩缩容功能，再设置作业优先级。开启动态扩缩容的更多参数设置请参考开启Flink作业动态扩缩容。 flink.dli

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
队列属性设置 - 数据湖探索 DLI

队列属性设置操作场景 DLI支持在队列创建完成后设置队列的属性。当前支持设置队列的Spark driver的相关参数：通过设置队列的Spark driver，以提升队列资源的调度效率。本节操作介绍在管理控制台设置队列属性的操作步骤。约束与限制仅Spark引擎的SQL队列支持配置队列属性。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

指定要使用的格式，这里应该是 'orc'。 Orc 格式也支持来源于 Table properties 的表属性。举个例子，您可以设置 orc.compress=SNAPPY 来允许spappy压缩。数据类型映射 Orc 格式类型的映射和 Apache Hive 是兼容的。下面的表格列出了 Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format

总条数： 705

上一页
1
2
3
4
5
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

怎样查看DLI的执行SQL记录？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

查询作业执行计划 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

SQL作业执行完成后，修改表名导致datasize不正确怎么办？ - 数据湖探索 DLI

执行查询语句报错：There should be at least one partition pruning predicate on partitioned table XX.YYY - 数据湖探索 DLI

执行SQL查询语句报错：DLI.0003: Permission denied for resource.... - 数据湖探索 DLI

Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

队列属性设置 - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线