搜索_华为云

Flink作业管理相关API - 数据湖探索 DLI

Flink作业管理相关API 触发Flink作业保存点导入Flink作业保存点

 帮助中心 > 数据湖探索 DLI > API参考
CLEANING - 数据湖探索 DLI
CLEANING - 数据湖探索 DLI

IONS', file_version_retained => 1); 注意事项 cleaning操作只有在满足触发条件后才会对分区的老版本数据文件进行清理，不满足触发条件虽然执行命令成功也不会执行清理。系统响应可以检查任务状态是否成功，查看任务结果，查看任务日志确认有无异常。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
DLI创建跨源连接，绑定队列一直在创建中怎么办？ - 数据湖探索 DLI

跨源连接创建慢，有以下几种可能：购买DLI队列后，第一次进行绑定队列。通常需要等待5~10分钟，待后台拉起集群后，即可创建成功。若刚刚对队列进行网段修改，立即进行绑定队列。通常需要等待5~10分钟，待后台重建集群后，即可创建成功。父主题：增强型跨源连接类

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Hudi Clustering操作说明 - 数据湖探索 DLI

plan.strategy.target.file.max.bytes", 1073741824). 手动触发1次Clustering Spark SQL（设置如下参数，手动触发1次） hoodie.clustering.inline=true hoodie.clustering.inline

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
为什么SQL作业一直处于“提交中”？ - 数据湖探索 DLI

等待5~10分钟，待后台拉起集群后，即可提交成功。若刚刚对队列进行网段修改，立即进行SQL作业的提交。需要等待5~10分钟，待后台重建集群后，即可提交功。按需队列，队列已空闲状态（超过1个小时），则后台资源已经释放。此时进行SQL作业的提交。需要等待5~10分钟，待后台重新拉起集群后，即可提交成功。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

原因分析：在数据的Commit阶段如果出现队列资源重启可能会导致数据已经被修复到正式目录中。如果执行的是Insert into语句，资源重启后触发重试就会有概率导致数据重复写入。解决方案：推荐使用具备ACID能力的Hudi类型数据源。建议尽量使用insert overwrite这样幂等的语法而不是insert

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
Spark SQL常用配置项说明 - 数据湖探索 DLI

如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区修剪优化，有助于减少内存使用，避免内存溢出和频繁的Full GC。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
弹性资源池CU设置 - 数据湖探索 DLI

通过调整当前弹性资源池中队列的最大CU或增加队列，以增大弹性资源池的实际CUs。当弹性资源池队列的最大CU的和大于弹性资源池的实际CUs时，会触发弹性资源池扩容，扩容后的实际CUs= min（队列的最大CU和，弹性资源池CU范围最大值）。通过“规格变更”将弹性资源池规格调整为80C

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
ARCHIVELOG - 数据湖探索 DLI
ARCHIVELOG - 数据湖探索 DLI

hoodie.compact.inline.max.delta.commits个Instant不会被归档，以此保证有足够的Instant去触发compation schedule。使用由DLI提供的元数据服务时，本命令不支持使用OBS路径。系统响应可以检查任务状态是否成功，

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

'; run compaction on 'obs://bucket/path/h1'; 注意事项使用API方式对SQL创建的Hudi表触发Compaction时需要添加参数hoodie.payload.ordering.field为preCombineField的值。使用由

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

ata 由于作业在触发CheckPoint时才会往Hudi表中写数据，所以需要开启CheckPoint。CheckPoint间隔根据业务需要调整，建议间隔调大。如果CheckPoint间隔太短，数据来不及刷新会导致作业异常；建议CheckPoint间隔为分钟级。 checkpo

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
故障恢复 - 数据湖探索 DLI
故障恢复 - 数据湖探索 DLI

故障恢复系统级故障恢复 DLI系统采用存算分离的架构，计算集群基于K8s资源调度和故障切换机制，在系统故障时，支持自动故障恢复。作业级故障恢复 Flink、Spark作业支持配置自动重启恢复机制，在开启自动重启功能后，当作业出现异常时将自动重启恢复作业。父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
设置SQL作业优先级 - 数据湖探索 DLI

对于每个作业都允许设置优先级，其取值为1-10，数值越大表示优先级越高。优先满足高优先级作业的计算资源，即如果高优先级作业计算资源不足，则会减少低优先级作业的计算资源 SQL队列上运行的作业优先级默认为3。调整作业优先级需要停止作业后编辑，并重新提交运行才能生效。设置SQL作业优先级在“ 设置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
设置Flink作业优先级 - 数据湖探索 DLI

12及以上版本的作业支持设置作业优先级。使用须知对于每个作业都允许设置优先级，其取值为1-10，数值越大表示优先级越高。优先满足高优先级作业的计算资源，即如果高优先级作业计算资源不足，则会减少低优先级作业的计算资源通用队列上运行的Flink作业优先级默认为5。作业优先级的调整需要停止作业进行编辑，并提交运行才能生效。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
设置Spark作业优先级 - 数据湖探索 DLI

5及以上版本的作业支持设置作业优先级。使用须知对于每个作业都允许设置优先级，其取值为1-10，数值越大表示优先级越高。优先满足高优先级作业的计算资源，即如果高优先级作业计算资源不足，则会减少低优先级作业的计算资源通用队列上运行的Spark作业的优先级默认为3。调整作业优先级需要停止作业后编辑，并重新提交运行才能生效。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
查看Flink作业详情 - 数据湖探索 DLI

作业删除后不可恢复，请谨慎操作。名称和描述修改：修改作业名称和描述。导入保存点：导入原实时流计算服务作业导出的数据。触发保存点：“运行中”的作业可以“触发保存点”，保存作业的状态信息。权限管理：查看作业对应的用户权限信息以及对其他用户授权。运行时配置：支持作业在运行时配置作业异常告警和异常自动重启。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

用户首次使用子账号创建队列时，需要先使用主账号登录控制台，在DLI的数据库中保持记录，才能创建队列。新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。按需队列创建完成后，如果在1小时内未运行作业，系统将进行释放。按需队列与包年/包月队列不能互相转换，如需使用包年/包月队列，直接购买即可。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Hudi数据表Archive规范 - 数据湖探索 DLI

Archive的开关默认打开(hoodie.archive.automatic默认为true)。 Archive操作并不是每次写数据时都会触发，至少需要满足以下两个条件： Hudi表满足hoodie.keep.max.commits设置的阈值。如果是Flink写hudi至少提交的

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
审计与日志 - 数据湖探索 DLI
审计与日志 - 数据湖探索 DLI

CTS支持配置关键操作通知。用户可将与IAM相关的高危敏感操作，作为关键操作加入到CTS的实时监控列表中进行监控跟踪。当用户使用DLI服务时，如果触发了监控列表中的关键操作，那么CTS会在记录操作日志的同时，向相关订阅者实时发送通知。 DLI的作业日志在创建DLI作业时，可以在作业编辑

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
流生态作业开发指引 - 数据湖探索 DLI

流生态作业开发指引流生态系统基于Flink和Spark双引擎，完全兼容Flink/Storm/Spark开源社区版本接口，并且在此基础上做了特性增强和性能提升，为用户提供易用、低时延、高吞吐的数据湖探索。数据湖探索的流生态开发包括云服务生态、开源生态和自拓展生态：云服务生态

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南

总条数： 254

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业管理相关API - 数据湖探索 DLI

CLEANING - 数据湖探索 DLI

DLI创建跨源连接，绑定队列一直在创建中怎么办？ - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

为什么SQL作业一直处于“提交中”？ - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

弹性资源池CU设置 - 数据湖探索 DLI

ARCHIVELOG - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

故障恢复 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

审计与日志 - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线