-
示例:通过本地文件导入导出数据 - 数据仓库服务 GaussDB(DWS)
// 将migration_table查询结果导出到本地文件d:/data.txt try { copyToFile(conn, "d:/data.txt", "(SELECT * FROM migration_table)");
-
多表连接查询 - 数据仓库服务 GaussDB(DWS)
行过滤。 简单总结就是:on条件优先于where条件,在两表进行连接时被应用;生成两表连接结果集后,再应用where条件。 父主题: 数据读取
-
单表查询 - 数据仓库服务 GaussDB(DWS)
550 jewels | 200 skin care | 320 electronics | 150 父主题: 数据读取
-
安装和启动GDS - 数据仓库服务 GaussDB(DWS)
创建用户gds_user及其所属的用户组gdsgrp。此用户用于启动GDS,且需要拥有读取数据源文件目录的权限。 1 2 groupadd gdsgrp useradd -g gdsgrp gds_user 修改工具包以及数据源文件目录属主为创建的用户gds_user及其所属的用户组gdsgrp。
-
WITH表达式 - 数据仓库服务 GaussDB(DWS)
不支持在单个语句中更新同一行两次。这种语句的效果是不可预测的。如果只有一个修改发生了,但却不容易(有时也不可能)预测哪一个发生了修改。 父主题: 数据读取
-
GDS导出示例 - 数据仓库服务 GaussDB(DWS)
-put - /user/hive/***/test_pipe.txt 验证导出的数据。 查看文件是否导出正确。 1 2 3 4 5 cat postgres_public_foreign_test_pipe_tw.txt 3,2,11111111111111 1,2,11111111111111
-
单表查询 - 数据仓库服务 GaussDB(DWS)
550 jewels | 200 skin care | 320 electronics | 150 父主题: 数据读取
-
WITH表达式 - 数据仓库服务 GaussDB(DWS)
不支持在单个语句中更新同一行两次。这种语句的效果是不可预测的。如果只有一个修改发生了,但却不容易(有时也不可能)预测哪一个发生了修改。 父主题: 数据读取
-
子查询表达式 - 数据仓库服务 GaussDB(DWS)
可能会导致查询性能问题和代码难阅读和理解。 所以在GaussDB等数据库中使用SQL子查询时,请结合实际业务情况进行操作。 父主题: 数据读取
-
多表连接查询 - 数据仓库服务 GaussDB(DWS)
行过滤。 简单总结就是:on条件优先于where条件,在两表进行连接时被应用;生成两表连接结果集后,再应用where条件。 父主题: 数据读取
-
gds - 数据仓库服务 GaussDB(DWS)
"gds-2020-01-17_115425.log"文件。 当-l指定的日志文件没有以log为后缀,例如:" gds.log.txt", 则新创建的日志文件名为" gds.log-2020-01-19_122739.txt"。 gds启动时会检测-l参数设置的日志文件是否存在,如果存在则根据当前日期
-
UNION操作符的使用 - 数据仓库服务 GaussDB(DWS)
虑是否需要选择临时表进行过渡后再合并。 需要考虑SQL编写的复杂度,不能为了写SQL而写SQL,需要结合业务需求进行选择。 父主题: 数据读取
-
GDS实践指南 - 数据仓库服务 GaussDB(DWS)
如果存在无法变更数据库,客户端,外表字符集时,可以尝试使用iconv命令进行手动转换。 1 2 #注意 -f 表示源文件的字符集,-t为目标字符集 iconv -f utf8 -t gbk utf8.txt -o gbk.txt 关于GDS导入实践可参考使用GDS导入数据。 GDS支持CSV、TEXT、FIX
-
下载并安装Data Studio客户端 - 数据仓库服务 GaussDB(DWS)
Studio启动后,会创建日志文件夹、Data Studio.log文件、Preferences文件夹、Preferences.prefs文件、Profile文件夹、connection.properties文件、Profiles.txt文件和security文件夹。 如果Data Studio
-
调用栈记录函数 - 数据仓库服务 GaussDB(DWS)
$GAUSSHOME/bin/gaussdb trace文件1 >prof.txt 方式2:以pdf格式输出。 jeprof --pdf --show_bytes $GAUSSHOME/bin/gaussdb trace文件1 > prof.pdf 解析内存调用栈信息,需要依靠G
-
安装配置和启动GDS - 数据仓库服务 GaussDB(DWS)
90,GDS监听端口为5000。 数据文件存放在“/input_data/”目录下。 错误日志文件存放在“/err”目录下。该目录需要拥有GDS读写权限的用户自行创建。 单个数据文件大小为100MB。 每个错误日志大小为100MB。 日志保存在“/log/gds_log.txt”文件中。该目录需要拥有GDS读写权限的用户自行创建。
-
安装配置和启动GDS - 数据仓库服务 GaussDB(DWS)
90,GDS监听端口为5000。 数据文件存放在“/input_data/”目录下。 错误日志文件存放在“/err”目录下。该目录需要拥有GDS读写权限的用户自行创建。 单个数据文件大小为100MB。 每个错误日志大小为100MB。 日志保存在“/log/gds_log.txt”文件中。该目录需要拥有GDS读写权限的用户自行创建。
-
调用栈记录函数 - 数据仓库服务 GaussDB(DWS)
$GAUSSHOME/bin/gaussdb trace文件1 >prof.txt 方式2:以pdf格式输出。 jeprof --pdf --show_bytes $GAUSSHOME/bin/gaussdb trace文件1 > prof.pdf 解析内存调用栈信息,需要依靠G
-
关于OBS并行导入 - 数据仓库服务 GaussDB(DWS)
其中DN0和DN1上分配了两个文件,其他DN分配了1个文件。 如果OBS上文件大小都相同时,OBS上的文件数与DN节点数的比例为1:1时导入性能为最好,因为每个DN分配的任务都相同。因此建议将数据文件存储到OBS前,尽可能均匀地将文件切分成多个,文件的数量以DN的整数倍更适合。 图1
-
gds - 数据仓库服务 GaussDB(DWS)
生成规则:GDS默认只识别后缀是log的文件重新生成日志文件。 例如,当-l参数指定为 gds.log,-R指定为20MB时,当gds.log达到20MB后就会新创建一个 "gds-2020-01-17_115425.log"文件。 当-l指定的日志文件没有以log为后缀,例如:" gds.log.txt", 则新创建的日志文件名为"