MAPREDUCE服务 MRS-配置Spark Python3样例工程:操作步骤
操作步骤
- 客户端机器必须安装有Python3,其版本不低于3.6。
在客户端机器的命令行终端输入python3可查看Python版本号。如下显示Python版本为3.8.2。
Python 3.8.2 (default, Jun 23 2020, 10:26:03) [GCC 4.8.5 20150623 (Red Hat 4.8.5-36)] on linux Type "help", "copyright", "credits" or "license" for more information.
- 客户端机器必须安装有setuptools,版本为47.3.1。
具体软件,请到对应的官方网站获取。
https://pypi.org/project/setuptools/#files
将下载的setuptools压缩文件复制到客户端机器上,解压后进入解压目录,在客户端机器的命令行终端执行python3 setup.py install。
如下内容表示安装setuptools的47.3.1版本成功。
Finished processing dependencies for setuptools==47.3.1
- 安装Python客户端到客户端机器。
- 参考获取 MRS 应用开发样例工程,获取样例代码解压目录中“src\hive-examples”目录下的样例工程文件夹“python3-examples”。
- 进入“python3-examples”文件夹。
- 根据python3的版本,选择进入“dependency_python3.6”或“dependency_python3.7”或“dependency_python3.8”文件夹。
- 执行whereis easy_install命令,找到easy_install程序路径。如果有多个路径,使用easy_install --version确认选择setuptools对应版本的easy_install,如/usr/local/bin/easy_install
- 使用对应的easy_install命令,依次安装dependency_python3.x文件夹下的egg文件。如:
/usr/local/bin/easy_install future-0.18.2-py3.8.egg
输出以下关键内容表示安装egg文件成功。
Finished processing dependencies for future==0.18.2
- 大数据分析是什么_使用MapReduce_创建MRS服务
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- 什么是Spark_如何使用Spark_Spark的功能是什么
- Hudi服务_什么是Hudi_如何使用Hudi
- MapReduce服务_什么是存算分离_如何配置MRS集群存算分离
- 什么是数据湖探索服务_数据湖探索DLI用途与特点
- MapReduce工作原理_MapReduce是什么意思_MapReduce流程_MRS_华为云
- 什么是Spark SQL作业_数据湖探索DLISpark SQL作业
- MapReduce服务_什么是Hue_如何使用Hue
- MapReduce服务_什么是HDFS_HDFS特性