搜索_华为云

故障恢复 - 数据湖探索 DLI
故障恢复 - 数据湖探索 DLI

故障恢复系统级故障恢复 DLI系统采用存算分离的架构，计算集群基于K8s资源调度和故障切换机制，在系统故障时，支持自动故障恢复。作业级故障恢复 Flink、Spark作业支持配置自动重启恢复机制，在开启自动重启功能后，当作业出现异常时将自动重启恢复作业。父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

发。环境准备在进行Spark Jar作业开发前，请准备以下开发环境。表1 Spark Jar作业开发环境准备项说明操作系统 Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

富的API，便于快速与其他数据系统的集成。 · Flink Jar作业：允许用户提交编译为Jar包的Flink作业，提供了更大的灵活性和自定义能力。适合需要自定义函数、UDF（用户定义函数）或特定库集成的复杂数据处理场景。可以利用Flink的生态系统，实现高级流处理逻辑和状态管理。

帮助中心 > 数据湖探索 DLI > 功能总览
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

DLI datasource v1表 DLI datasource v2表（以下简称V2表）：spark开源的Datasource表，建表/插入/truncate命令使用spark开源的command，表的数据路径为$tablepath/数据文件。图2 DLI datasource

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark2.4.x与Spark3.3.x版本差异对比
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

x-dependencies.jar。 DBeaver客户端安装包： DBeaver官网提供了针对不同操作系统的客户端安装包，单击下载DBeaver访问DBeaver官网下载系统对应的DBeaver客户端安装包并完成安装。推荐使用24.0.3版本的DBeaver。连接信息：表1

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
查询作业执行进度信息 - 数据湖探索 DLI

Integer 子作业ID，对应开源spark JobData的jobId。 name 否 String 子作业name，对应开源spark JobData的name。 description 否 String 子作业description，对应开源spark JobData的description。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
使用Hive语法创建OBS表 - 数据湖探索 DLI

要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。推荐使用OBS并行文件系统进行存储。并行文件系统是一种高性能文件系统，提供毫秒级别访问时延，TB/s级别带宽和百万级别的IOPS，适用于大数据交互式分析场景。注意事项创建表时会统计大小。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

Hudi源表功能描述 Flink SQL读取Hudi表数据。更多具体使用可参考开源社区文档：Hudi。注意事项建议Hudi作为Source表时设置限流 Hudi表作为Source表时，为防止数据上限超过流量峰值导致作业出现异常，建议设置限流（read.rate.limit），限流上限应该为业务上线压测的峰值。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

Hudi 结果表功能描述 Flink SQL作业写Hudi表。更多具体使用可参考开源社区文档：Hudi。注意事项推荐使用SparkSQL统一建表表名必须满足Hive格式要求表名必须以字母或下划线开头，不能以数字开头。表名只能包含字母、数字、下划线。表名长度不能超过128个字符。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
Flink 1.12版本说明 - 数据湖探索 DLI

Flink 1.12版本说明数据湖探索（DLI）遵循开源Flink计算引擎的发布一致性。本文介绍Flink 1.12版本所做的变更说明。更多Flink 1.12版本说明请参考Release Notes - Flink 1.12。 Flink 1.12版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Spark 3.1.1版本说明 - 数据湖探索 DLI

Spark 3.1.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.1.1版本所做的变更说明。更多Spark 3.1.1版本说明请参考Spark Release Notes。 Spark 3.1.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Spark 3.3.1版本说明 - 数据湖探索 DLI

Spark 3.3.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.3.1版本所做的变更说明。更多Spark 3.3.1版本说明请参考Spark Release Notes。 Spark 3.3.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Spark 2.4.5版本说明 - 数据湖探索 DLI

Spark 2.4.5版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 2.4.5版本所做的变更说明。更多Spark 2.4.5版本说明请参考Spark Release Notes。 Spark 2.4.5版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
对象存储OBS源表 - 数据湖探索 DLI

对象存储OBS源表功能描述文件系统连接器可用于将单个文件或整个目录的数据读取到单个表中。当使用目录作为source路径时，对目录中的文件进行无序的读取。更多信息参考文件系统 SQL 连接器语法格式 1 2 3 4 5 6 7 8 9 10 11 CREATE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
配置DLI作业桶 - 数据湖探索 DLI

操作前准备配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
FileSytem结果表 - 数据湖探索 DLI

FileSytem结果表功能描述 FileSystem结果表用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。数据生成后，可直接对生成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
删除函数 - 数据湖探索 DLI
删除函数 - 数据湖探索 DLI

TEMPORARY：所删除的函数是否为临时函数。 IF EXISTS：所删除的函数不存在时使用，可避免系统报错。注意事项删除一个已存在的函数。如果要删除的函数不存在，则系统报错。只支持HIVE语法。示例删除函数mergeBill。 1 DROP FUNCTION mergeBill;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
创建DLI自定义委托权限 - 数据湖探索 DLI

全局服务资源：全局服务部署时不区分区域，访问全局级服务，不需要切换区域，全局服务不支持基于区域项目授权。如对象存储服务（OBS）、内容分发网络（CDN）等。授权后，用户根据权限使用全局服务的资源。指定区域项目资源：授权后，IAM用户根据权限使用所选区域项目中的资源，未选择的区域项目中的资源，该IAM用户将无权访问。

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
Over聚合 - 数据湖探索 DLI
Over聚合 - 数据湖探索 DLI

聚合值。和 GROUP BY 聚合不同， OVER 聚合不会把结果通过分组减少到一行，它会为每行输入增加一个聚合值。更多介绍和使用请参考开源社区文档：Over聚合。语法格式 1 2 3 4 5 6 7 SELECT agg_func(agg_col) OVER (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
使用DataSource语法创建OBS表 - 数据湖探索 DLI

要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。推荐使用OBS并行文件系统进行存储。并行文件系统是一种高性能文件系统，提供毫秒级别访问时延，TB/s级别带宽和百万级别的IOPS，适用于大数据交互式分析场景。注意事项创建表时不会统计大小。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表

总条数： 413

上一页
1
2
3
4
5
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

故障恢复 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

Flink 1.12版本说明 - 数据湖探索 DLI

Spark 3.1.1版本说明 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

对象存储OBS源表 - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

删除函数 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

Over聚合 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线