搜索_华为云

最佳实践内容概览 - 数据湖探索 DLI

以DLI实际消费数据为样例，介绍使用DLI进行账单分析和成本优化的措施。使用DLI分析电商实时业务数据使用DLI Flink完成电商业务实时数据的分析处理。配置DBeaver连接DLI进行数据查询和分析介绍DBeaver连接DLI并提交SQL查询的操作步骤。配置DBT连接DLI进行数据调度和分析介绍使用DBT提交DLI作业的操作步骤。

帮助中心 > 数据湖探索 DLI > 最佳实践
设置Flink作业优先级 - 数据湖探索 DLI

设置Flink Jar作业优先级在“优化参数”中配置如下参数，其中x为优先级取值。 flink.dli.job.priority=x 登录DLI管理控制台。单击“作业管理 > Flink作业”。选择待配置的作业，单击操作列下的编辑。在“优化参数”中输入如下语句。先开启动态扩缩容功能，再设置作业优先级。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
创建Flink Jar作业 - 数据湖探索 DLI

于授予DLI访问其他服务的操作权限。优化参数用户自定义的优化参数。参数格式为key=value。 Flink优化参数支持非敏感的全局变量替换。例如，在“全局配置”>“全局变量”中新增全局变量phase，Flink Jar作业就可以添加优化参数table.optimizer.agg-phase

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
配置DLI作业桶 - 数据湖探索 DLI

System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。使用须知请勿将该O

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
Spark SQL常用配置项说明 - 数据湖探索 DLI

点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区修剪优化，有助于减少内存使用，避免内存溢出和频繁的Full GC。但禁用此优化可能会降低查询性能，禁用后Spark将不会自动修剪掉那些不满足条件的分区。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Flink作业推荐配置指导 - 数据湖探索 DLI

机发送消息通知，方便客户及时感知异常。图4 作业异常告警勾选“开启Checkpoint”，依据自身业务情况调整Checkpoint间隔和模式。Flink Checkpoint机制可以保证Flink任务突然失败时，能够从最近的Checkpoint进行状态恢复重启。图5 checkpoint参数

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表在Hive元数据中，应该会存在1张内部表（手动创建），2张外部表（写入数据后自动创建）。 2张外部表，表名_ro（用户只读合并后的parquet文件，即读优化视图表），_rt（读实时写入的最新版本数据，即实时视图表）。父主题： Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 DLI提供了Spark和Flink计算引擎，为用户提供了一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务，当前，Flink计算引擎推荐版本：Flink 1.15，Spark计算引擎推荐版本： Spark 3.3.1。本节操作介绍如何升级作业的引擎版本。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Flink 1.15版本说明 - 数据湖探索 DLI

Jar作业最小化提交是指Flink仅提交作业必须的依赖项，而不是整个Flink环境。通过将非Connector的Flink依赖项（以flink-开头）和第三方库（如Hadoop、Hive、Hudi、Mysql-cdc）的作用域设置为provided，可以确保这些依赖项不会被包含在Jar作业中

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
查询SQL作业日志 - 数据湖探索 DLI

System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

机发送消息通知，方便客户及时感知异常。图4 作业异常告警勾选“开启Checkpoint”，依据自身业务情况调整Checkpoint间隔和模式。Flink Checkpoint机制可以保证Flink任务突然失败时，能够从最近的Checkpoint进行状态恢复重启。图5 checkpoint参数

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
查询Flink作业日志 - 数据湖探索 DLI

System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
查询Spark作业日志 - 数据湖探索 DLI

System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

在执行Group By聚合操作时，如果某些分组键对应的数据量特别大，而其他分组键对应的数据量很小，在聚合过程中，数据量大的分组会占用更多的计算资源和时间，导致处理速度变慢，出现数据倾斜。 JOIN 操作倾斜在执行表JOIN操作时，参与JOIN的键在某个表中分布极不均匀，导致大量数据集中

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

) from pg_stat_activity WHERE state='idle'; 检查应用程序是否未主动释放连接，导致连接残留。建议优化代码，合理释放连接。在GaussDB(DWS) 控制台设置会话闲置超时时长session_timeout，在闲置会话超过所设定的时间后服务端将主动关闭连接。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
提交SQL作业（推荐） - 数据湖探索 DLI

点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区修剪优化，有助于减少内存使用，避免内存溢出和频繁的Full GC。但禁用此优化可能会降低查询性能，禁用后Spark将不会自动修剪掉那些不满足条件的分区。表4 tags参数参数名称

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
开启Flink作业动态扩缩容 - 数据湖探索 DLI

SQL作业和Flink Jar作业。登录DLI管理控制台。单击“作业管理 > Flink作业”。选择要开启动态扩缩容的作业，单击操作列下的编辑。 Flink Opensource SQL作业单击“自定义配置”，配置动态扩缩容参数。 Flink Jar作业单击“优化参数”框，配置动态扩缩容参数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

second=3600 flink.dli.job.agency.name=*** Flink Jar作业示例。环境准备已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 pom文件配置中依赖包 <properties> <flink.version>1

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

TVFs）的操作之上，比如窗口聚合，窗口Top-N和窗口关联。窗口 Top-N 的语法和普通的 Top-N 相同。除此之外，窗口 Top-N 需要 PARTITION BY 子句包含窗口表值函数或窗口聚合产生的 window_start 和 window_end。否则优化器无法翻译。更多介绍和使用请参考开源社区文档：窗口Top-N。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
DLI常用跨源分析开发方式 - 数据湖探索 DLI

开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。推荐使用增强型跨源连接打通DLI与数据源之间的网络。跨源分析开发方式表1提供DLI支持的数据源对应的开发方式。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）

总条数： 825

上一页
1
...
7
8
9
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

最佳实践内容概览 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

Flink 1.15版本说明 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线