MAPREDUCE服务 MRS-SparkStreaming批量写入HBase表:Python样例代码

时间：2024-06-29 14:11:35

Python样例代码

下面代码片段仅为演示，具体代码参见SparkOnHbasePythonExample中HBaseStreamingBulkPutExample文件：

# -*- coding:utf-8 -*-
"""
【说明】
由于pyspark不提供Hbase相关api,本样例使用Python调用Java的方式实现
"""
from py4j.java_gateway import java_import
from pyspark.sql import SparkSession
# 创建SparkSession
spark = SparkSession\
        .builder\
        .appName("JavaHBaseStreamingBulkPutExample")\
        .getOrCreate()
# 向sc._jvm中导入要运行的类
java_import(spark._jvm, 'com.huawei.bigdata.spark.examples.streaming.JavaHBaseStreamingBulkPutExample')
# 创建类实例并调用方法，传递sc._jsc参数
spark._jvm.JavaHBaseStreamingBulkPutExample().execute(spark._jsc, sys.argv)
# 停止SparkSession
spark.stop()

上一篇：MAPREDUCE服务 MRS-SparkStreaming批量写入HBase表:数据规划

下一篇：MAPREDUCE服务 MRS-SparkStreaming批量写入HBase表:数据规划