搜索_华为云

Spark 2.4.5版本说明 - 数据湖探索 DLI

Spark 2.4.5版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 2.4.5版本所做的变更说明。更多Spark 2.4.5版本说明请参考Spark Release Notes。 Spark 2.4.5版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Over聚合 - 数据湖探索 DLI
Over聚合 - 数据湖探索 DLI

聚合值。和 GROUP BY 聚合不同， OVER 聚合不会把结果通过分组减少到一行，它会为每行输入增加一个聚合值。更多介绍和使用请参考开源社区文档：Over聚合。语法格式 1 2 3 4 5 6 7 SELECT agg_func(agg_col) OVER (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代

 帮助中心 > 数据湖探索 DLI > 用户指南
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 DLI Livy简介 DLI Livy是基于开源的Apache Livy用于提交Spark作业到DLI的客户端工具。准备工作创建DLI队列。在“队列类型”中选择“通用队列”，即Spark作业的计算资源。具体请参考创建队列。准备一个li

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

Hudi 结果表功能描述 Flink SQL作业写Hudi表。更多具体使用可参考开源社区文档：Hudi。注意事项推荐使用SparkSQL统一建表表名必须满足Hive格式要求表名必须以字母或下划线开头，不能以数字开头。表名只能包含字母、数字、下划线。表名长度不能超过128个字符。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

对接的DLI服务的Region。根据Spark应用程序的需要，修改“spark-defaults.conf”中的配置项，配置项兼容开源Spark配置项，参考开源Spark的配置项说明。使用Spark-submit提交Spark作业进入工具文件bin目录，执行spark-submit命令，并携带相关参数。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 DBeaver 是一个免费且开源的数据库管理工具，支持多种数据库，通过DBeaver这款可视化数据库管理工具可以查看数据库结构、执行SQL查询和脚本、浏览和导出数据等。本节操作介绍DBeaver连接DLI服务的操作步骤。操作前准备

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
查询作业执行进度信息 - 数据湖探索 DLI

Integer 子作业ID，对应开源spark JobData的jobId。 name 否 String 子作业name，对应开源spark JobData的name。 description 否 String 子作业description，对应开源spark JobData的description。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 Superset是一个开源的数据探索和可视化平台，支持对数据进行快速、直观的探索，同时支持创建丰富的数据可视化和交互式仪表板。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 DBT（Data Build Tool），是一款开源的数据建模和转换工具，运行在Python环境上。DBT连接DLI，用来定义和执行SQL转换，支持从数据集成、转换到分析的整个数据生命周期管理，适用于大规模数据分析项目和复杂的数据分析场景。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
DLI Delta表概述 - 数据湖探索 DLI

0。 Spark 3.3.1（3.0.0）版本的SQL仍有部分不支持Delta表的相关开源语法，具体内容请参考表1。表1 Spark 3.3.1-3.0.0版本SQL不支持的Delta表相关开源语法不支持的语法示例 ALTER TABLE REPLACE COLUMNS替换列

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
内置函数 - 数据湖探索 DLI
内置函数 - 数据湖探索 DLI

内置函数具体使用请参考开源社区文档：内置函数。比较函数逻辑函数算术函数字符串函数时间函数条件函数类型转换函数集合函数 JSON函数值构建函数值获取函数分组函数 Hash函数聚合函数表值函数父主题：函数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
跨源认证权限管理 - 数据湖探索 DLI

用户组。跨源认证用户授权登录DLI管理控制台。单击“跨源管理 > 跨源认证”。选择要进行授权的跨源认证，单击操作列“权限管理”进入开源认证的用户权限信息页面。单击页面右上角“授权”可对当前的跨源认证新增用户授权。图1 跨源认证用户授权表1 用户授权参数说明参数名称

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
数据湖探索简介 - 数据湖探索 DLI

圈。数据湖探索的流生态分为云服务生态和开源生态：云服务生态：数据湖探索在Flink SQL中支持与其他服务的连通。用户可以直接使用SQL从这些服务中读写数据。如DIS、OBS、CloudTable、MRS、RDS、SMN、DCS等。开源生态：通过增强型跨源连接建立与其他VPC

帮助中心 > 数据湖探索 DLI > 产品介绍
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

运行失败且超过1分钟(日志转储周期1分钟)，会在application_xx下生成运行日志。另外，由于DLI服务端已经内置了Flink的依赖包，并且基于开源社区版本做了安全加固。为了避免依赖包兼容性问题或日志输出及转储问题，打包时请注意排除以下文件：系统内置的依赖包，或者在Maven或者Sb

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

SQL语法参考》。发布区域：全部使用DLI提交SQL作业查询OBS数据导出SQL作业结果 OBS 2.0支持 DLI Spark作业 DLI在开源Spark基础上进行了大量的性能优化与服务化改造，兼容Apache Spark生态和接口，执行批处理任务。 DLI还支持使用Spark作业

 帮助中心 > 数据湖探索 DLI > 功能总览
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

移除重复数据，就像窗口TopN一样。理论上，窗口是一种特殊的窗口 Top-N：N是1并且是根据处理时间或事件时间排序的。更多介绍和使用请参考开源社区文档：窗口去重。语法格式 SELECT [column_list] FROM ( SELECT [column_list],

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

推荐使用DLI Flink 1.15版本。 Flink 1.15版本有哪些优势？ Flink 1.15版本在语法设计上实现了更高的兼容性，与主流开源技术标准保持一致。 Flink 1.15版本新增读写Hive、Hudi等Connector。更多Flink 1.15版本的优势请参考Flink

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

自建大数据生态的调度工具，如Airflow。企业级多租户基于表的权限管理，可以精细化到列权限。基于文件的权限管理。高性能性能基于软硬件一体化的深度垂直优化。大数据开源版本性能。跨源分析支持多种数据格式，云上多种数据源、ECS自建数据库以及线下数据库，数据无需搬迁，即可实现对云上多个数据源进行分析，构

 帮助中心 > 数据湖探索 DLI > 产品介绍
Flink作业性能调优 - 数据湖探索 DLI

WHEN flag IN ('android', 'iphone')THEN user_id ELSE NULL END) AS app_uv 可调整为 COUNT(DISTINCT user_id) FILTER(WHERE flag IN ('android', 'iphone'))

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类

总条数： 83

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark 2.4.5版本说明 - 数据湖探索 DLI

Over聚合 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

内置函数 - 数据湖探索 DLI

跨源认证权限管理 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线