搜索_华为云

触发Flink作业保存点 - 数据湖探索 DLI

触发Flink作业保存点功能介绍触发Flink作业保存点。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v1.0/{project_id}/str

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业管理相关API
Flink作业常用操作 - 数据湖探索 DLI

业。图1 停止作业在停止作业之前，用户可以触发保存点，保存作业的状态信息。当该作业再次启动时用户可以选择是否从保存点恢复。勾选“触发保存点”表示创建保存点。不勾选“触发保存点”表示不创建保存点。默认不创建保存点。保存点的生命周期从触发保存点并停止作业开始，重启作业后结束。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
批量运行作业 - 数据湖探索 DLI

批量运行作业功能介绍该API用于触发批量运行作业。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v1.0/{project_id}/streaming/jobs/run 参数说明表1 URI参数说明参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

to refresh. 问题根因 API以同步模式调用运行时会有两分钟的超时时间限制，如果API调用超过该时间限制则会超时报错。解决方案调用“提交SQL作业”API时可以通过设置“dli.sql.sqlasync.enabled”参数为“true”来异步运行该作业。具体可以参考提交SQL作业API。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

创建队列功能介绍该API用于创建队列，该队列将会绑定用户指定的计算资源。新队列第一次运行作业时，需要一定的时间，通常为5~15分钟。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v1.0/{project_id}/queues 参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
弹性资源池CU设置 - 数据湖探索 DLI

弹性资源池CU设置 CU设置主要是为了控制弹性资源池扩缩容的最大最小CU范围，避免无限制的资源扩容风险。例如，当前弹性资源池CU设置的最大CU为256CU，并且该弹性资源池添加了2个队列，2个队列扩缩容策略最小CU数为64CU，这时如果该弹性资源池再添加一个队列并且该队列最小CU为2

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

间是 30 分钟，当其不活跃的时间达到30分钟后，若观测到新的记录，则会启动一个新的会话时间窗口（否则该行数据会被添加到当前的窗口），且若在 30 分钟内没有观测到新纪录，这个窗口将会被关闭。会话时间窗口可以使用事件时间（批处理、流处理）或处理时间（流处理）。在流处理表中的 SQL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

）的不重叠的连续窗口。比如，5 分钟的滚动窗口以 5 分钟为间隔对行进行分组。滚动窗口可以定义在事件时间（批处理、流处理）或处理时间（流处理）上。 HOP(time_attr, interval, interval) 定义一个跳跃的时间窗口（在 Table API 中称为滑动窗口）。滑动窗口有一个固定的持续时间（

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

）的不重叠的连续窗口。例如，5 分钟的滚动窗口以 5 分钟为间隔对行进行分组。滚动窗口可以定义在事件时间（批处理、流处理）或处理时间（流处理）上。 HOP(time_attr, interval, interval) 定义一个跳跃的时间窗口（在 Table API 中称为滑动窗口）。滑动窗口有一个固定的持续时间（

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
创建消息通知主题 - 数据湖探索 DLI

短信或者邮件等）进行订阅。订阅成功后，如果作业失败，则系统将会自动发送消息到您指定的订阅终端。如果作业提交1分钟内立即失败，通常不会触发消息通知。如果作业提交1分钟后失败，则系统将会自动发送消息到您指定的订阅终端。操作步骤在“资源管理 > 队列管理”页面，单击左上角“创建消息通知主题”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
使用CES监控DLI服务 - 数据湖探索 DLI

队列最大CU 展示用户队列中的最大CU。 ≥0 队列 5分钟 queue_priority 队列优先级展示用户队列的优先级。 1~100 队列 5分钟 queue_cpu_usage 队列CPU使用率展示用户队列的CPU使用率。该指标仅适用于普通队列。 0~100 队列 5分钟 queue_disk_usage

帮助中心 > 数据湖探索 DLI > 用户指南
Flink作业管理相关API - 数据湖探索 DLI

Flink作业管理相关API 触发Flink作业保存点导入Flink作业保存点

 帮助中心 > 数据湖探索 DLI > API参考
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

问题现象 SQL作业中存在join操作，作业提交后状态一直是运行中，没有结果返回。问题根因 Spark SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操作会增加executor的内存消耗，如果executor内存不够时，导致作业运行失败。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
开启Flink作业动态扩缩容 - 数据湖探索 DLI

如30表示每隔30分钟进行一次检测，判断是否需要对作业使用资源量进行扩缩。注意：只有当用户开启动态扩缩时，该配置才有意义。 flink.dli.job.cu.max 用户CU初始值该配置表示当前作业在进行动态扩缩时允许使用的最大CU数，如果用户未配置则默认值为该作业的初始总CU数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

从checkpoint恢复的原则通常当作业执行失败、资源异常重启等非人为触发的异常场景时，支持从checkpoint恢复。但是如果修改了作业的运算逻辑，作业的计算逻辑已发生更改，不支持从checkpoint恢复。应用场景本文列举了一些常见的从checkpoint恢复的场景供您参考，如表1所示。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
跨源认证概述 - 数据湖探索 DLI

12版本的跨源访问场景，使用DLI提供的“跨源认证”管理数据源的访问凭证。本节操作为您介绍DLI提供的跨源认证的使用方法。约束与限制表1 跨源认证约束限制限制项说明适用场景约束限制仅Spark SQL、和Flink OpenSource SQL 1.12版本的作业支持使用跨源认证。仅在

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

16CUs队列不支持扩容和缩容。 64CUs队列不支持缩容。约束限制表1 队列使用约束限制限制项说明资源类型队列类型： default队列：DLI服务预置了名为“default”的队列供用户体验，资源的大小按需分配。运行作业时按照用户每个作业的数据扫描量（单位为“GB”）收取计算费用。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Hudi Clean操作说明 - 数据湖探索 DLI

Flink（with属性里设置如下参数，写数据时触发） clean.async.enabled=true clean.retain_commits=10 // 默认值为10，根据业务场景指定手动触发1次clean Spark SQL（set设置如下参数，手动触发1次） hoodie.clean

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Hudi Clustering操作说明 - 数据湖探索 DLI

对于每个组使用strategyParams实例化适当的策略类（例如：sortColumns），然后应用该策略重写数据。创建一个REPLACE提交，并更新HoodieReplaceCommitMetadata中的元数据。如何执行Clustering Spark SQL（设置如下参数，写数据时触发） hoodie.clustering

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
清理多版本数据 - 数据湖探索 DLI

清理多版本数据功能描述多版本数据保留周期是在表每次执行insert overwrite或者truncate语句时触发，所以当表的多版本数据在保留周期时间外但是后续该表不会再执行insert overwrite或者truncate语句时，多版本保留周期外的数据不会自动清理。可以

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据

总条数： 1036

上一页
1
2
3
4
5
...
52
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

触发Flink作业保存点 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

批量运行作业 - 数据湖探索 DLI

创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

弹性资源池CU设置 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

创建消息通知主题 - 数据湖探索 DLI

使用CES监控DLI服务 - 数据湖探索 DLI

Flink作业管理相关API - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线