检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建数据仓库集群GaussDB(DWS),并导入MRS的Hive数据,实现跨集群进行大数据融合分析。 1.5h 二次开发 使用Java进行二次开发 使用JDBC驱动连接GaussDB(DWS)进行二次开发,熟悉简单的适配DWS的Java开发用例。 1.5h 数据迁移 从老DWS集群迁移数据到新DWS集群
创建存放GDS工具包的目录。 mkdir -p /opt/bin/dws 将GDS工具包上传至上一步所创建的目录中。 以上传SUSE Linux版本的工具包为例 ,将GDS工具包“dws_client_8.x.x_suse_x64.zip”上传至上一步所创建的目录中。 (可选)如
执行器 行执行引擎 向量化执行引擎 分布式执行框架
SCP工具),将客户端工具上传到一个待安装gsql的Linux主机上。 执行上传gsql操作的用户需要对客户端主机的目标存放目录有完全控制权限。 或者,您也可以先SSH远程登录到需要安装gsql的Linux主机,然后在Linux命令窗口,执行以下命令下载gsql客户端: wget
------------------------------- Postgres-XC 1.1 on x86_64-unknown-linux-gnu, based on PostgreSQL 9.2.4, compiled by g++ (GCC) 5.4.0, 64-bit
------------------------------- Postgres-XC 1.1 on x86_64-unknown-linux-gnu, based on PostgreSQL 9.2.4, compiled by g++ (GCC) 5.4.0, 64-bit
------------------------------- Postgres-XC 1.1 on x86_64-unknown-linux-gnu, based on PostgreSQL 9.2.4, compiled by g++ (GCC) 5.4.0, 64-bit
ssl(服务器)。 如果使用GaussDB(DWS)提供的gsql客户端或ODBC驱动,GaussDB(DWS)支持的SSL协议为TLSv1.2。 如果使用GaussDB(DWS)提供的JDBC驱动,支持的SSL协议有SSLv3、TLSv1、TLSv1.1、TLSv1.2。客户端
ssl(服务器)。 如果使用GaussDB(DWS)提供的gsql客户端或ODBC驱动,GaussDB(DWS)支持的SSL协议为TLSv1.2。 如果使用GaussDB(DWS)提供的JDBC驱动,支持的SSL协议有SSLv3、TLSv1、TLSv1.1、TLSv1.2。客户端
v.dws.huaweicloud.com。 使用gsql命令行客户端连接集群 使用root用户远程登录到需要安装gsql的Linux主机,然后在Linux命令窗口,执行以下命令下载gsql客户端: 1 wget https://obs.cn-north-1.myhuaweicloud
根据错误表中的提示诊断加载错误并更正这些错误。 视频介绍 准备ECS作为GDS服务器 购买Linux弹性云服务器的操作步骤,请参见《弹性云服务器快速入门》中的自定义购买弹性云服务器。购买后,请参见登录Linux弹性云服务器进行登录。 ECS操作系统必须是GDS工具包所支持的操作系统。 EC
主机上监听到备机连接请求,并接受后,就会创建一个WAL Sender线程,用于处理与备机的交互。 RHEL Red Hat Enterprise Linux,红帽企业Linux。 REDO日志 记录对数据库进行操作的日志,这些日志包含重新执行这些操作所需要的信息。当数据库故障时,可以利用REDO日志将数据库恢复到故障前的状态。
主机上监听到备机连接请求,并接受后,就会创建一个WAL Sender线程,用于处理与备机的交互。 RHEL Red Hat Enterprise Linux,红帽企业Linux。 REDO日志 记录对数据库进行操作的日志,这些日志包含重新执行这些操作所需要的信息。当数据库故障时,可以利用REDO日志将数据库恢复到故障前的状态。
出数据以及查询数据的操作。 GaussDB(DWS)为用户提供了PB(petabyte)级高性能数据库,主要体现在: MPP大规模并行处理框架,支持行列混存、向量化执行,实现万亿数据关联分析秒级响应。 内存计算,基于Bloom Filter的Hash Join优化,性能提升2~10倍。
区都留了少量空间供系统管理员使用。即使遇到普通用户空间已满的情况,系统管理员仍能登录和留有解决问题所需的工作空间。 磁盘容量采集源自于linux的df命令,举例如下: /dev/sda4: Used(5757444) + Available(540228616) != Total(569616888)
讯即可),例如192.168.0.0/24。 -l log_file:存放GDS的日志文件路径及文件名。 -D:后台运行GDS。仅支持Linux操作系统下使用。 父主题: GDS方式导入
log:SQL迁移中对输入文件的成功写次数。 Perl迁移日志 perlDSC.log:Perl迁移中所有的活动、预警和错误。 Apache Log4j用于指定DSC记录日志的框架。用户可使用以下Log4j配置文件,也可以根据需要进行自定义: Teradata/Oracle/Netezza/DB2 : config/log4j2
version();语句查询当前数据库版本号,版本号不同,调整的方式不同: 8.0.x及以前版本,通过重建表时指定分布列来调整: 通过Data Studio或者Linux下使用gsql访问数据库。 创建新表。 以下步骤语句中,table1为原表名,table1_new为新表名,column1和column2为分布列名称。
操作简单,适用于小批量数据入库。 使用COPY FROM STDIN导入数据 其他文件或数据库 使用Java语言开发应用程序时,通过调用JDBC驱动的CopyManager接口,从文件或其他数据库向GaussDB(DWS)写入数据。 从其他数据库直接写入GaussDB(DWS)的方式,具有业务数据无需落地成文件的优势。
enable_fast_query_shipping=on 控制查询优化器是否使用分布式框架,执行快速执行计划。设置为“on”,表示执行计划在CN和DN上各自生成;设置为“off”,表示使用分布式框架,即执行计划在CN上生成,然后发送到DN中执行。 说明: 如果只需要在当前数据库连接