搜索_华为云

创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

选择Spark版本。在下拉列表中选择支持的Spark版本，推荐使用最新版本。不建议长期混用不同版本的Spark/Flink引擎。长期混用不同版本的Spark/Flink引擎会导致代码在新旧版本之间不兼容，影响作业的执行效率。当作业依赖于特定版本的库或组件，长期混用不同版本的Spa

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DLI对接LakeFormation - 数据湖探索 DLI

在表1中提供了支持对接LakeFormation获取元数据的队列和引擎类型。查看队列的引擎类型和版本请参考查看队列的基本信息。表1 LakeFormation获取元数据的队列和引擎类型队列类型引擎类型和支持的版本 default队列 Spark 3.3.x：支持对接LakeFormation获取元数据的队列和引擎。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
FileSystem源表 - 数据湖探索 DLI
FileSystem源表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。语法格式 1 2 3 4 5 6 7 create

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

在委托设置页面，勾选基础使用、跨源场景、运维场景的委托权限后，单击“更新委托权限”。查看并了解更新委托的提示信息，单击“确定”。完成DLI委托权限的更新。图1 配置DLI委托访问授权完成配置后，在IAM控制台的委托列表中，可查看到dli_management_agency的委托信息。步骤1：准备数据源通道

 帮助中心 > 数据湖探索 DLI > 快速入门
使用Hive语法创建OBS表 - 数据湖探索 DLI

开启数据多版本功能，用于表数据的备份与恢复。开启多版本功能后，在进行删除或修改表数据时（insert overwrite或者truncate操作），系统会自动备份历史表数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作而丢失数据。多版本功能SQL语法请

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

给自定义镜像打标签。 docker tag 6中的[自定义组织名称]/[自定义镜像名称]:[自定义镜像版本] [镜像仓库地址]/[组织名称]/[自定义镜像名称:自定义版本名称] 示例： docker tag mydli/spark:2.4 swr.xxx/testdli0617/spark:2

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
DLI Delta元数据 - 数据湖探索 DLI

3.3.1及以上版本支持对接Lakeformation元数据），对接方式与Spark一致。 DLI元数据可在数据湖探索管理控制台的“数据管理 > 库表管理”中查看。 Lakeformation元数据可在湖仓构建Lakeformation服务的管理控制台中查看。相关操作 DLI

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业
设置Spark作业优先级 - 数据湖探索 DLI

DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。 Spark 2.4.5及以上版本的作业支持设置作业优先级。使用须知对于每个作业都允许设置优先级，其取值为1-10，数值越大表示优先级越高。优先满足高优先级作业的计算资

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
查询SQL作业日志 - 数据湖探索 DLI

储在该OBS桶中。图2 设置DLI作业桶查询SQL作业日志登录DLI管理控制台，单击“作业管理 > SQL作业”。选择待查询的SQL作业，单击操作列的“更多 > 归档日志”。系统自动跳转至DLI作业桶日志路径下。选择需要查看的日期，单击操作列的“ 下载”，下载SQL作业日志到本地。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询OpenTSDB表 - 数据湖探索 DLI
查询OpenTSDB表 - 数据湖探索 DLI

查询OpenTSDB表 SELECT命令用于查询OpenTSDB表中的数据。若OpenTSDB上不存在metric，查询对应的DLI表会报错。若OpenTSDB开了安全模式，则访问时，需要设置conf:dli.sql.mrs.opentsdb.ssl.enabled=true

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

功能描述 print connector用于将用户输出的数据打印到error文件或者taskmanager的out文件中，方便用户查看，主要用于代码调试，查看输出结果。语法格式 1 2 3 4 5 6 7 create table printSink ( attr_name attr_type

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Doris结果表 - 数据湖探索 DLI
Doris结果表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 create table hudiSource ( attr_name

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
使用CDM迁移数据至DLI - 数据湖探索 DLI

时，可配置编码格式。 utf8 驱动版本 CDM连接关系数据库前，需要先上传所需关系数据库的JDK8版本.jar格式驱动。MySQL的驱动请从https://downloads.mysql.com/archives/c-j/选择5.1.48版本下载，从中获取mysql-connector-java-5

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
类型转换函数 - 数据湖探索 DLI

sql作业，输入以下作业运行脚本，提交运行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
查询作业列表 - 数据湖探索 DLI

查询作业列表功能介绍查询当前用户的作业列表，可以根据作业ID作为ID，查询大于ID或小于ID的限定条数的作业，默认查询全部状态的作业，也可以设定运行中或其他状态条件。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{projec

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
SHOW语法使用概要 - 数据湖探索 DLI

SHOW语法使用概要 SHOW语法主要用来查看数据库对象的相关信息，其中LIKE子句用来对数据库对象过滤，匹配规则如下，具体示例可参看SHOW TABLES：规则1：_可以用来匹配单个任意字符。规则2：%可以用来匹配0个或者任意个任意字符。规则3：* 可以用来匹配0个或者任意个任意字符。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

已创建包含Hive组件的MRS安全集群。创建MRS集群的操作详细可以参考创建MRS集群。本示例创建的MRS集群和各组件版本如下： MRS集群版本：MRS 3.1.0 Hive版本：3.1.0 Hadoop版本：3.1.1 本示例创建MRS集群时开启了Kerberos认证。已创建CDM迁移集群。创建CDM集群的操作可以参考创建CDM集群。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
查询Spark作业日志 - 数据湖探索 DLI

OBS桶中。图2 设置DLI作业桶查询Spark作业日志登录DLI管理控制台，单击“作业管理 > Spark作业”。选择待查询的Spark作业，单击操作列的“更多 > 归档日志”。系统自动跳转至DLI作业桶日志路径下。选择需要查看的日期，单击操作列的“下载”下载Spark日志到本地。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
修改表生命周期的时间 - 数据湖探索 DLI

约束限制表生命周期处于公测阶段，如果有需要请联系客服申请开通白名单。表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理

总条数： 788

上一页
1
...
8
9
10
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Spark作业 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

FileSystem源表 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

DLI Delta元数据 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

查询OpenTSDB表 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

Doris结果表 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

SHOW语法使用概要 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线