MAPREDUCE服务 MRS-使用Jupyter Notebook对接MRS Spark:步骤4:验证Jupyter Notebook访问MRS

时间:2024-06-13 09:39:15

步骤4:验证Jupyter Notebook访问 MRS

  1. 在客户端节点执行如下命令,启动Jupyter Notebook。

    PYSPARK_PYTHON=./Python/bin/python3 PYSPARK_DRIVER_PYTHON=jupyter-notebook PYSPARK_DRIVER_PYTHON_OPTS="--allow-root" pyspark --master yarn --executor-memory 2G --driver-memory 1G

  2. 在浏览器中输入“弹性IP地址:9999”地址,登录到Jupyter WebUI(保证E CS 的安全组对外放通本地公网IP和9999端口),登录密码为2设置的密码。

    图2 登录Jupyter WebUI

  3. 创建代码。

    创建一个新的python3任务,使用Spark读取文件。

    图3 创建Python任务

    登录到集群Manager界面,在Yarn的WebUI页面上查看提交的pyspark应用。

    图4 查看任务运行情况

  4. 验证pandas库调用。

    图5 验证pandas

support.huaweicloud.com/bestpractice-mrs/mrs_05_0134.html