MAPREDUCE服务 MRS-使用Jupyter Notebook对接MRS Spark:步骤4:验证Jupyter Notebook访问MRS
步骤4:验证Jupyter Notebook访问 MRS
- 在客户端节点执行如下命令,启动Jupyter Notebook。
PYSPARK_PYTHON=./Python/bin/python3 PYSPARK_DRIVER_PYTHON=jupyter-notebook PYSPARK_DRIVER_PYTHON_OPTS="--allow-root" pyspark --master yarn --executor-memory 2G --driver-memory 1G
- 在浏览器中输入“弹性IP地址:9999”地址,登录到Jupyter WebUI(保证E CS 的安全组对外放通本地公网IP和9999端口),登录密码为2设置的密码。
图2 登录Jupyter WebUI
- 创建代码。
创建一个新的python3任务,使用Spark读取文件。
图3 创建Python任务
登录到集群Manager界面,在Yarn的WebUI页面上查看提交的pyspark应用。
图4 查看任务运行情况
- 验证pandas库调用。
图5 验证pandas
- 华为云资料 2021年 4月刊
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- ModelArts开发环境_开发环境简介_开发环境怎么使用
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离
- 大数据分析是什么_使用MapReduce_创建MRS服务
- MapReduce服务_什么是Hue_如何使用Hue
- MapReduce服务_什么是Hive_如何使用Hive
- MapReduce服务_什么是Loader_如何使用Loader
- MapReduce工作原理_MapReduce是什么意思_MapReduce流程_MRS_华为云
- 数据备份归档在哪里_数据分析存储系统_大数据存储管理