数据仓库服务 GAUSSDB(DWS)-导入数据:安装和启动GDS

时间:2024-09-24 17:41:12

安装和启动GDS

  1. 参见工具下载下载GDS客户端(与gsql客户端在一个包)。
  2. 将GDS工具包上传至E CS 的/opt目录中,本例以上传Euler Kunpeng版本的工具包为例。
  3. 在工具包所在目录下,解压工具包。

    cd /opt/
    unzip dws_client_8.1.x_euler_kunpeng_x64.zip

  4. 创建用户gds_user及其所属的用户组gdsgrp。此用户用于启动GDS,且需要拥有读取数据源文件目录的权限。

    groupadd gdsgrp
    useradd -g gdsgrp gds_user

  5. 修改工具包以及数据源文件目录属主为创建的用户gds_user及其所属的用户组gdsgrp。

    chown -R gds_user:gdsgrp /opt/
    chown -R gds_user:gdsgrp /data1
    chown -R gds_user:gdsgrp /data2

  6. 切换到gds_user用户。

    su - gds_user

  7. 执行环境依赖脚本(仅8.1.x版本适用)。

    cd /opt/gds/bin
    source gds_env

  8. 启动GDS。

    /opt/gds/bin/gds -d /data1/script/tpch-kit/tpch1000X -p 192.168.0.90:5000 -H 192.168.0.0/24 -l /opt/gds/gds01_log.txt -D        #TPC-H使用
    /opt/gds/bin/gds -d /data2/script/tpch-kit/tpch1000X -p 192.168.0.90:5001 -H 192.168.0.0/24 -l /opt/gds/gds02_log.txt -D       #TPC-H使用
    /opt/gds/bin/gds -d /data1/script/tpcds-kit/tpcds1000X/ -p 192.168.0.90:5002 -H 192.168.0.0/24 -l /opt/gds/gds03_log.txt -D        #TPC-DS使用
    /opt/gds/bin/gds -d /data2/script/tpcds-kit/tpcds1000X/ -p 192.168.0.90:5003 -H 192.168.0.0/24 -l /opt/gds/gds04_log.txt -D       #TPC-DS使用
    /opt/gds/bin/gds -d /data1/script/ssb-kit/ssb100X/ -p 192.168.0.90:5004 -H 192.168.0.0/24 -l /opt/gds/gds05_log.txt -D    #SSB使用

    • 命令中的斜体部分请根据实际填写,如果数据分片存放至多个数据盘目录,需要启动对应目录数量的GDS。
    • 如果TPC-H和TPC-DS数据同时测试,需要启动以上4个GDS,如果只测试TPC-DS或TPC-H数据,请根据后面的“#xxx”备注启动对应的GDS服务即可。
    • -d dir:保存有待导入数据的数据文件所在目录。
    • -p ip:port:GDS监听IP和监听端口。IP替换为ECS的内网IP,确保 GaussDB (DWS)能通过此IP与GDS的通讯;端口对于TPC-H取5000、5001,对于TPC-DS取5002、5003。
    • -H address_string:允许哪些主机连接和使用GDS服务。参数需为CIDR格式。此地址配置成GaussDB(DWS)的集群内网网段(即GDS所在的ECS与GaussDB(DWS)在同一个VPC下,以内网通讯即可),例如192.168.0.0/24。
    • -l log_file:存放GDS的日志文件路径及文件名。
    • -D:后台运行GDS。仅支持Linux操作系统下使用。

support.huaweicloud.com/pwp-910-dws/dws_13_00012.html