华为云首页用户手册

数据湖探索 DLI-使用Spark Jar作业读取和查询OBS数据:开发流程

数据湖探索 DLI-使用Spark Jar作业读取和查询OBS数据:开发流程

时间：2024-12-05 10:45:40

数据湖探索 DLI

开发流程

DLI 进行Spark Jar作业开发流程参考如下：

图1 Spark Jar作业开发流程
点击放大

点击放大

表2 开发流程说明
序号	阶段	操作界面	说明
1	创建DLI通用队列	DLI控制台	创建作业运行的DLI队列。
2	上传数据到OBS桶	OBS控制台	将测试数据上传到OBS桶下。
3	新建Maven工程，配置pom文件	IntelliJ IDEA	参考样例代码说明，编写程序代码读取OBS数据。
4	编写程序代码
5	调试，编译代码并导出Jar包
6	上传Jar包到OBS和DLI	OBS控制台 DLI控制台	将生成的Spark Jar包文件上传到OBS目录下和DLI程序包中。
7	创建Spark Jar作业	DLI控制台	在DLI控制台创建Spark Jar作业并提交运行作业。
8	查看作业运行结果	DLI控制台	查看作业运行状态和作业运行日志。

上一篇：数据湖探索 DLI-使用Spark Jar作业读取和查询OBS数据:环境准备

下一篇：数据湖探索 DLI-使用Spark Jar作业读取和查询OBS数据:环境准备

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

数据湖探索 DLI-使用Spark Jar作业读取和查询OBS数据:开发流程

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题