MAPREDUCE服务 MRS-通过JDBC访问Spark SQL样例程序开发思路:数据规划

时间:2024-06-29 14:10:54

数据规划

将数据文件上传至HDFS中。

  1. 确保以多主实例模式启动了JD BCS erver服务,并至少有一个实例可连接客户端。在Linux系统HDFS客户端新建一个文本文件“data”,内容如下:

    Miranda,32
    Karlie,23
    Candice,27

  2. 在HDFS路径下建立一个目录,例如创建“/home”,并上传“data”文件到此目录,命令如下:

    1. 登录HDFS客户端节点,执行如下命令:

      cd {客户端安装目录}

      source bigdata_env

    2. 执行如下命令创建目录“/home”:

      hdfs dfs -mkdir /home

    3. 执行如下命令上传数据文件:

      hdfs dfs -put data /home

  3. 确保其对启动JDB CS erver的用户有读写权限。
  4. 确保客户端classpath下有“hive-site.xml”文件,且根据实际集群情况配置所需要的参数。JDBCServer相关参数详情,请参见Spark JDBCServer接口介绍
support.huaweicloud.com/devg3-mrs/mrs_07_410028.html