检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
停止GDS GDS是GaussDB(DWS)提供的数据服务工具,通过和外表机制的配合,实现数据的高速导出。 当不在使用GDS时,可通过以下步骤停止GDS。 操作步骤 以gds_user用户登录安装GDS的数据服务器。 请根据启动GDS的方式,选择停止GDS的方式。 若用户使用“g
vacuum_freeze_table_age 参数说明:指定VACUUM对全表的扫描冻结元组的时间。如果表的pg_class.relfrozenxid字段的值已经达到了参数指定的时间,VACUUM对全表进行扫描。 参数类型:USERSET 取值范围:整型,0~576 460 752 303
pg_scan_residualfiles 扫描当前节点当前库中所有符合特征的残留文件。 9 pgxc_scan_residualfiles 扫描多个节点当前库中所有符合特征的残留文件。 10 pg_get_scan_residualfiles 获取当前节点扫描到的残留文件列表。 11 pgx
ODBC接口的使用方法,请自行查阅官方文档。 前提条件 已下载Linux版本的ODBC驱动包“dws_x.x.x_odbc_driver_for_xxx.zip”和Windows版本的ODBC驱动包“dws_odbc_driver_for_windows.zip”,请参见下载JDBC或ODBC驱动。
从官网获取TPC-DS数据构建工具dsdgen最新版本,并通过SFTP工具上传到ECS的/data1/script/tpcds-kit目录。 执行如下命令解压tpcds的包并编译生成数据构建工具dsdgen。 “tpcds_3.2.0.zip”替换为实际的软件包名。 “DSGen-software-code-3
vacuum_freeze_table_age 参数说明:指定VACUUM对全表的扫描冻结元组的时间。如果表的pg_class.relfrozenxid字段的值已经达到了参数指定的时间,VACUUM对全表进行扫描。 参数类型:USERSET 取值范围:整型,0~576 460 752 303
表Scan压力均匀分散在各个DN上,以避免单DN的Scan压力过大,形成Scan的单节点瓶颈。分布列不选择基表上等值filter中的列可以实现该点。 减少扫描数据量。通过分区的剪枝机制可以实现该点。 尽量减少随机IO。通过聚簇/局部聚簇可以实现该点。 尽量避免数据shuffle,减小网络压力。通
buffers_clean bigint 后端写进程写的缓冲区数量。 maxwritten_clean bigint 由于写入缓冲区太多,后端写进程停止清理扫描的次数。 buffers_backend bigint 后端直接写入的缓冲区数量。 buffers_backend_fsync bigint
数据库的数据。 操作步骤 准备ECS作为gsql客户端主机。 请参见下载客户端下载gsql客户端,并使用SSH文件传输工具(例如WinSCP工具),将客户端工具上传到一个待安装gsql的Linux主机上。 执行上传gsql操作的用户需要对客户端主机的目标存放目录有完全控制权限。
buffers_clean bigint 后端写进程写的缓冲区数量。 maxwritten_clean bigint 由于写入缓冲区太多,后端写进程停止清理扫描的次数。 buffers_backend bigint 后端直接写入的缓冲区数量。 buffers_backend_fsync bigint
表Scan压力均匀分散在各个DN上,以避免单DN的Scan压力过大,形成Scan的单节点瓶颈。分布列不选择基表上等值filter中的列可以实现该点。 减少扫描数据量。通过分区的剪枝机制可以实现该点。 尽量减少随机IO。通过聚簇/局部聚簇可以实现该点。 尽量避免数据shuffle,减小网络压力。通
范围查询性能要求高的场景,可以创建Partial Cluster Key(局部聚簇,简称PCK)通过min/max稀疏索引实现事实表快速过滤扫描。PCK的选取遵循以下原则: 【关注】一张表上只能建立一个PCK,一个PCK可以包含多列,但是一般不建议超过2列。 【建议】针对表达式过滤条件列创建PCK(形如col
禁止针对行存大表的频繁COUNT 磁盘能力强的场景(如SSD),本规则可适当放宽,但仍需关注I/O消耗情况。 违反规范的影响: 行存表的COUNT需要扫描全表,大表场景频繁COUNT会消耗大量I/O,如触发I/O瓶颈会导致整体性能问题。 方案建议: 建议降低COUNT频率、使用结果缓存、分区
SSB数据生成 下载ssb工具包并编译。 git clone http://github.com/vadimtk/ssb-dbgen.git cd ssb-dbgen && make 生成数据。 文件生成路径最好符合安装和启动GDS中SSB所使用的路径,否则需要修改安装和启动GDS中GDS的启动路径。
仅导出数据,不包含所有对象定义。 操作步骤 准备ECS作为gsql客户端主机。 请参见下载客户端下载gsql客户端,并使用SSH文件传输工具(例如WinSCP工具),将客户端工具上传到一个待安装gsql的Linux主机上。 执行上传gsql操作的用户需要对客户端主机的目标存放目录有完全控制权限。
范围查询性能要求高的场景,可以创建Partial Cluster Key(局部聚簇,简称PCK)通过min/max稀疏索引实现事实表快速过滤扫描。PCK的选取遵循以下原则: 【关注】一张表上只能建立一个PCK,一个PCK可以包含多列,但是一般不建议超过2列。 【建议】针对表达式过滤条件列创建PCK(形如col
GAUSS-03773: "unsupported data type length %d" SQLSTATE: XX000 错误原因:列存表扫描,数据类型不支持。 解决办法:检查数据类型。 GAUSS-03774: "Column store don't support" SQLSTATE:
禁止针对行存大表的频繁COUNT 磁盘能力强的场景(如SSD),本规则可适当放宽,但仍需关注I/O消耗情况。 违反规范的影响: 行存表的COUNT需要扫描全表,大表场景频繁COUNT会消耗大量I/O,如触发I/O瓶颈会导致整体性能问题。 方案建议: 建议降低COUNT频率、使用结果缓存、分区
从官网获取TPC-H工具。 登录ECS云服务器,执行如下命令创建TPC-H存放目录。 mkdir -p /data1/script/tpch-kit/tpch1000X mkdir -p /data2/script/tpch-kit/tpch1000X 将获取的TPC-H工具上传到ECS
完成导出动作。 操作步骤 准备ECS作为gsql客户端主机。 请参见下载客户端下载gsql客户端,并使用SSH文件传输工具(例如WinSCP工具),将客户端工具上传到一个待安装gsql的Linux主机上。 执行上传gsql操作的用户需要对客户端主机的目标存放目录有完全控制权限。