华为云首页用户手册

MAPREDUCE服务 MRS-使用Spark执行Hudi样例程序开发思路:运行任务

MAPREDUCE服务 MRS-使用Spark执行Hudi样例程序开发思路:运行任务

时间：2024-06-13 09:38:48

MAPREDUCE服务 MRS 使用Spark执行Hudi样例程序

运行任务

登录Spark客户端节点，执行如下命令：
source 客户端安装目录/bigdata_env

source 客户端安装目录/Hudi/component_env
编译构建样例代码后可以使用spark-submit提交命令，执行命令后会依次执行写入、更新、查询、删除等操作：
- 运行Java样例程序：
  spark-submit --class com.huawei.bigdata.hudi.examples.HoodieWriteClientExample /opt/example/hudi-java-examples-1.0.jar hdfs://hacluster/tmp/example/hoodie_java hoodie_java
  
  其中：“/opt/example/hudi-java-examples-1.0.jar”为jar包路径，“hdfs://hacluster/tmp/example/hoodie_java”为Hudi表的存储路径，“ hoodie_java”为Hudi表的表名。
- 运行Scala样例程序：
  spark-submit --class com.huawei.bigdata.hudi.examples.HoodieDataSourceExample /opt/example/hudi-scala-examples-1.0.jar hdfs://hacluster/tmp/example/hoodie_scala hoodie_scala
  
  其中：“/opt/example/hudi-scala-examples-1.0.jar”为jar包路径，“hdfs://hacluster/tmp/example/hoodie_scala”为Hudi表的存储路径，“ hoodie_Scala”为Hudi表的表名。
- 运行Python样例程序：
  spark-submit /opt/example/HudiPythonExample.py hdfs://hacluster/tmp/huditest/example/python hudi_trips_cow
  
  其中：“hdfs://hacluster/tmp/huditest/example/python”为Hudi表的存储路径，“ hudi_trips_cow”为Hudi表的表名。

上一篇：MAPREDUCE服务 MRS-如何处理Flink任务配置State Backend为RocksDB时报错GLIBC版本问题:问题

下一篇：MAPREDUCE服务 MRS-由于Kafka配置的限制，导致Spark Streaming应用运行失败:回答

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

MAPREDUCE服务 MRS-使用Spark执行Hudi样例程序开发思路:运行任务

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题