搜索_华为云

使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

在“tpchQuery”下找到适合您业务场景的样例模板，单击操作列的“执行”进入SQL编辑器页面。在SQL编辑器页面右侧的编辑窗口上方，“执行引擎”选择“spark”，“队列”选择“default”，“数据库”选择“default”，单击“执行”。 SQL作业编辑窗口下方“查看结果”页签查看查询结果。本示例使用

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

“default”为内置数据库，不能创建名为“default”的数据库。在DLI管理控制台，单击左侧导航栏中的“SQL编辑器”，可进入SQL作业“数据库”页面。在“SQL编辑器”页面右侧的编辑窗口中，输入如下SQL语句，单击“执行”。阅读并同意隐私协议，单击“确定”。 create database

帮助中心 > 数据湖探索 DLI > 快速入门
Flink作业常用操作 - 数据湖探索 DLI

行操作，包括编辑作业基本信息，启停作业、导入/导出作业等。编辑作业用户可以对已经创建的作业进行编辑，如修改SQL语句、作业名称和描述、作业配置信息等。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，进入Flink作业管理页面。在需要编辑作业对应的“

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

userDefined源表功能描述您可通过编写代码实现从云生态或者开源生态获取数据，再把获取到的数据作为Flink作业的输入数据。前提条件自定义source类需要继承类RichParallelSourceFunction，并指定数据类型为Row。例如自定义类MySource：public

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

Hive结果表功能描述本节介绍利用Flink写Hive的表。Hive结果表的定义，以及创建结果表时使用的参数和示例代码。详情可参考：Apache Flink Hive Read & Write Flink 支持在 BATCH 和 STREAMING 模式下从Hive写入数据。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

功能描述 Print connector用于将用户输出的数据打印到error文件或者taskmanager的文件中，方便用户查看，主要用于代码调试，查看输出结果。前提条件无。注意事项 Print结果表支持以下四种格式内容输出：打印内容条件1 条件2 标识符:任务 ID>

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？问题现象手动在OBS表的分区目录下上传了分区数据，但是在SQL编辑器中查询该表新增的分区数据时却查询不到。解决方案手动添加分区数据后，需要刷新OBS表的元数据信息。具体操作如下： MSCK REPAIR TABLE

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
查看表元数据 - 数据湖探索 DLI

SQL编辑器”页面。在“数据管理”页面查看元数据。在管理控制台左侧，单击“数据管理”>“库表管理”。单击需导出数据对应数据库名称，进入该数据库“表管理”页面。单击目标表“操作”栏中的“更多”，选择“表属性”，即可在“元数据”页签查看该表的元数据信息。在“SQL编辑器”页面查看元数据。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

本例介绍通过DLI控制台提交Jar作业程序包的基本流程。由于不同的业务需求，Jar包的具体编写会有所差异。建议您参考DLI提供的示例代码，并根据实际业务场景进行相应的编辑和定制。获取DLI样例代码。操作流程使用DLI提交Spark Jar作业的操作流程如表1所示。开始进行如下操作前，请务必参考准备工作完成必要操作。

帮助中心 > 数据湖探索 DLI > 快速入门
在DLI控制台删除表 - 数据湖探索 DLI

删除表的入口有两个，分别在“数据管理”和“SQL编辑器”页面。在“数据管理”页面删除表。在管理控制台左侧，单击“数据管理”>“库表管理”。单击需删除表的数据库名，进入该数据库的“表管理”页面。选中目标表，单击“操作”栏中的“更多 > 删除表”。在弹出的确认对话框中，单击“是”。在“SQL编辑器”页面删除表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
在DLI控制台修改数据库所有者 - 数据湖探索 DLI

> 修改数据库”。在弹出的对话框中，输入新的所有者用户名（已存在的用户名），单击“确定”。在“SQL编辑器”页面修改数据库所有者。在管理控制台左侧，单击“SQL编辑器”。在左侧导航栏单击选择“数据库”页签，鼠标左键单击对应数据库右侧的，在列表菜单中选择“修改数据库”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
FileSystem源表 - 数据湖探索 DLI
FileSystem源表 - 数据湖探索 DLI

FileSystem源表功能描述本节介绍FileSystem源表的定义，以及创建源表时使用的参数和示例代码。前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
在Spark SQL作业中使用UDF - 数据湖探索 DLI

+ b; } } 编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。图9 编译打包打包成功后

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
管理Flink作业模板 - 数据湖探索 DLI

+-@ 。单击“确定”，进入“编辑”页面。模板编辑页面参数说明参考表5。表5 编辑模板参数说明功能描述名称可以修改模板名称。描述可以修改模板描述。保存方式修改：将修改保存至当前的模板中。新增：将修改另存为新的模板。 SQL语句编辑区域输入详细的SQL语句，实

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

x不再支持将Apache Mesos作为资源管理器说明： Spark2.4.x：Spark 2.4.x版本中使用Apache Mesos作为资源管理器。 Spark3.3.x：Spark3.3.x不再支持将Apache Mesos作为资源管理器。升级引擎版本后是否对作业有影响：功能增强，Spark

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
初始化DLI客户端 - 数据湖探索 DLI

Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下。完整样例代码和依赖包说明请参考：Python SDK概述。 AK/SK认证方式样例代码代码样例 1 2 3 4 5 6 7 8 def init_aksk_dli_client():

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
管理Spark作业模板 - 数据湖探索 DLI

管理Spark作业模板操作场景在创建Spark作业时，您可以在已有的Spark样例模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。当前云平台尚未提供预置的Spark模板，但支持用户自定义Spark作业模板，本节操作介绍在Spark管理页面创建Spark模板的操作方法。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

最后调用close方法，对需要清理的方法进行清理。编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。图9 编译打包打包成功后

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南

总条数： 464

上一页
1
2
3
4
5
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

查看表元数据 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

在DLI控制台删除表 - 数据湖探索 DLI

在DLI控制台修改数据库所有者 - 数据湖探索 DLI

FileSystem源表 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线