MAPREDUCE服务 MRS-Python样例代码:环境准备

时间:2024-06-19 14:14:17

环境准备

  1. 安装支持环境。(开发环境请参考Spark应用开发环境简介准备)

    执行以下命令安装编译工具:

    yum install cyrus-sasl-devel -y

    yum install gcc-c++ -y

  2. 安装相应的python模块。

    需要安装sasl,thrift,thrift-sasl,PyHive。

    pip install sasl

    pip install thrift

    pip install thrift-sasl

    pip install PyHive

  3. 安装python连接zookeeper工具。

    pip install kazoo

  4. MRS 集群上获取相应参数。
    • zookeeper的IP和PORT:

      可以查看配置文件/opt/client/Spark/spark/conf/hive-site.xml中的配置项spark.deploy.zookeeper.url

    • zookeeper 上存放JD BCS erver主节点的IP和PORT:

      可以查看配置文件/opt/client/Spark/spark/conf/hive-site.xml中的配置项spark.thriftserver.zookeeper.dir(默认是/thriftserver),在此znode子节点(active_thriftserver)上存放了JDB CS erver主节点的IP和PORT

support.huaweicloud.com/devg-mrs/mrs_06_0480.html