搜索_华为云

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复什么是从checkpoint恢复？ Flink Checkpoint 是一种容错恢复机制。这种机制保证了实时程序运行时，遇到异常或者机器问题时能够进行自我恢复。从checkpoint恢复的原则通常当作业执行失败

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
SQL作业运行慢如何定位 - 数据湖探索 DLI

SQL作业运行慢如何定位作业运行慢可以通过以下步骤进行排查处理。可能原因1：FullGC原因导致作业运行慢判断当前作业运行慢是否是FullGC导致：登录DLI控制台，单击“作业管理 > SQL作业”。在SQL作业页面，在对应作业的“操作”列，单击“更多 > 归档日志”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
where - 数据湖探索 DLI
where - 数据湖探索 DLI

where_condition where逻辑判断条件。 and 逻辑运算符：与。 or 逻辑运算符：或。 not 逻辑运算符：非。 ( 子逻辑判断条件开始。 ) 子逻辑判断条件结束。 condition 逻辑判断条件。 exists 关键字，用于判断是否存在一个不为空的集合，若exist

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代码的编写与作业的开发，使用Not

帮助中心 > 数据湖探索 DLI > 用户指南
怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

怎样判断当前DLI队列中的作业是否有积压？问题描述需要查看DLI的队列中作业状态为“提交中”和“运行中”的作业数，判断当前队列中的作业是否有积压。解决方案可以通过“云监控服务 CES”来查看DLI队列中不同状态的作业情况，具体操作步骤如下：在控制台搜索“云监控服务 CES”，进入云监控服务控制台。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
使用DLI分析账单消费数据 - 数据湖探索 DLI

使用DLI分析账单消费数据应用场景本文主要介绍如何使用华为云DLI上的实际消费数据（文中涉及账户的信息已脱敏），在DLI的大数据分析平台上进行分析，找出费用优化的空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤：步骤1：获取消费数据。获取账户的实际消费数据。

帮助中心 > 数据湖探索 DLI > 最佳实践
如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

本章节介绍REST API请求的组成，并以调用IAM服务的获取用户Token来说明如何调用API，该API获取用户的Token，Token可以用于调用其他API时鉴权。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
手动续费 - 数据湖探索 DLI
手动续费 - 数据湖探索 DLI

所有需手动续费的资源都可归置到“手动续费项”页签，具体操作请参见如何恢复为手动续费。手动续费资源。单个续费：在资源页面找到需要续费的资源，单击操作列的“续费”。批量续费：在资源页面勾选需要续费的资源，单击列表左上角的“批量续费”。选择续费时长，判断是否勾选“统一到期日”，将到期时间统一到各个

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
Hudi Compaction操作说明 - 数据湖探索 DLI

ion包含两个过程Schedule和Run。Schedule过程会在TimeLine里生成一个Compaction Plan，这个Compaction Plan会记录哪些parquet文件将会与哪些log文件进行合并，但是仅仅是一个Plan，没有去合并。Run过程会将TimeLine里的所有Compaction

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
SQL作业执行完成后，修改表名导致datasize不正确怎么办？ - 数据湖探索 DLI

结果不正确。这是因为DLI在执行SQL作业时，会对表进行元数据更新，如果在作业执行完成前修改了表名，会和作业的元数据更新过程冲突，从而影响对数据大小的判断。为了避免这种情况，建议在SQL作业执行完成后，等待5分钟后再修改表名。确保系统有足够的时间更新表的元数据，避免因修改表名而导致的数据大小统计不准确的问题。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

请参考判断是否经购买了对应的套餐包套餐包额度已用完请参考判断套餐包额度是否超出购买的套餐包没有涵盖到DLI所有计费项请参考判断是否产生了套餐包未涵盖的计费项如果处理完某个可能原因仍未解决问题，请继续排查其他可能原因。判断是否经购买了对应的套餐包目前DLI支持的套餐包类型如表1所示。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
Hudi表使用约束 - 数据湖探索 DLI

计算引擎版本 Hudi版本 Spark 3.3.1 0.11.0 Flink 1.15 0.11.0 Hetu 2.1.0 0.11.0 如何判断队列支持的计算引擎版本：首先进入DLI的控制台界面，点击左侧菜单栏的”资源管理”-> ”队列管理”。在队列管理的界面筛选并选中需要查询的

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
Flink作业性能调优类 - 数据湖探索 DLI

Flink作业性能调优类 Flink作业推荐配置指导 Flink作业性能调优 Flink作业重启后，如何保证不丢失数据？ Flink作业运行异常，如何定位 Flink作业重启后，如何判断是否可以从checkpoint恢复 DLI Flink作业提交运行后（已选择保存作业日志到OBS桶

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
Hudi数据表Clean规范 - 数据湖探索 DLI

udi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean。对于Hudi的MOR、COW表，都需要开启Clean。 Hudi表在写入数据时会自动判断是否需要执行Clean，因为Clean的开关默认打开(hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DLI作业开发流程 - 数据湖探索 DLI

Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。定义您的数据结构，包括数据目录、数据库、表。请参考创建数据库和表。创建必要的存储桶来存储作业运行过程中产生的临时数据：作业日志、作业结果等。请参考配置DLI作业桶。配置元数据的访问权限。请参考在DLI控制台配置数据库权限、在DLI控制台配置表权限。

帮助中心 > 数据湖探索 DLI > 用户指南
开启Flink作业动态扩缩容 - 数据湖探索 DLI

t恢复，因此未恢复成功前，作业无法处理数据。因扩缩容过程中需要触发savepoint，因此必须配置obs桶，并保存日志，同时请注意开启checkpoint。扩缩容检测周期不要设置过小，避免频繁启停作业。扩缩容作业恢复过程中的时间长短受savepoint的大小影响，如果保存点较大，可能恢复时间较慢。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ Flink Jar作业上传配置文件操作流程自定义(JAR)作业支持上传配置文件。将配置文件通过程序包管理上传到DLI；在Flink jar作业的其他依赖文件参数中，选择创建的DLI程序包；在代码中通过ClassName

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
管理DLI全局变量 - 数据湖探索 DLI

DLI支持在管理控制台设置全局变量，将作业开发过程中频繁使用的变量设置为全局变量，可以避免在编辑作业过程中重复定义，减少开发与维护成本。通过使用全局变量可以替换长难复杂变量，简化复杂参数，提升SQL语句可读性。本节操作为您介绍如何创建全局变量。创建全局变量在DLI控制台左侧导航栏中单击“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作

总条数： 319

上一页
1
2
3
4
5
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

where - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

如何合并小文件 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

手动续费 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

SQL作业执行完成后，修改表名导致datasize不正确怎么办？ - 数据湖探索 DLI

已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

Flink作业性能调优类 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线