检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
可通过较小不必要的数据扫描,从而提升查询性能 在查询时,可通过分区剪枝技术尽可能减少底层数据扫描,即缩小表的扫描范围。分区剪枝是指对于分区表或分区索引来说,优化器可以自动从FROM和WHERE子句里根据分区键提取出需要扫描的分区,从而避免全表扫描,减少扫描的数据块,提高性能。 优化前
1.1.0升级到1.1.1。 持续时间:整个升级过程将花费不到10分钟。 业务影响:在此期间,如果升级源版本至8.1.3及以上版本,则支持在线补丁,补丁升级期间不要求用户停止业务,业务存在秒级闪断。如果在8.1.3以下版本业务会中断1至3分钟,建议在业务低峰期进行。 服务升级:表示集群版本X
准备工具 迁移过程需准备的工具包括:PL/SQL Developer、Instant Client和DSC,下载地址参见表1 表1 准备工具 工具名 描述 下载地址 PL/SQL Developer Oracle可视化开发工具 PL/SQL Developer下载地址 Oracle
BTEQ工具命令 GaussDB(DWS)提供了一系列gsql元命令,可以等价替换常用的BTEQ工具命令。常用BTEQ命令的转换行为如下: .QUIT | .EXIT | .RETURN 元命令\q [value]支持退出gsql程序,且可以通过value值指定退出码。.QUIT、
服务端工具 gs_dump gs_dumpall gs_restore gds_check gds_install gds_uninstall gds_ctl ESLDoTrust.py DisasterFineGrained.py
gds_install 背景信息 gds_install是用于批量安装gds的脚本工具,可大大提高GDS部署效率。 注意事项 执行脚本前需设置环境变量,可参考《开发指南》中“导入数据>通过外表并行导入>安装配置和启动GDS”章节。 脚本需要在python 3环境下运行。 必须在r
ESLDoTrust.py ESLDoTrust.py简介 命令行参考 父主题: 服务端工具
gs_restore 背景信息 gs_restore是GaussDB(DWS)提供的针对gs_dump导出数据的导入工具。通过此工具可由gs_dump生成的导出文件进行导入。 主要功能包含: 导入到数据库 如果连接参数中指定了数据库,则数据将被导入到指定的数据库中。其中,并行导入必须指定连接的密码。
出所有数据库相关信息工具,它可以导出集群数据库的所有数据,包括默认数据库postgres的数据、自定义数据库的数据、以及集群所有数据库公共的全局对象。 gs_dumpall工具在进行数据导出时,其他用户可以访问集群数据库(读或写)。 gs_dumpall工具支持导出完整一致的数据
gds_uninstall 背景信息 gds_uninstall是用于批量卸载GDS的脚本工具。 注意事项 执行脚本前需设置环境变量,可参考《开发指南》中“导入数据>通过外表并行导入>安装配置和启动GDS”章节。 脚本需要在python 3环境下运行。 必须在root用户下执行脚本gds_uninstall。
可以避免数据倾斜。 【关注】将表的扫描压力均匀分散在各个DN上。避免扫描压力集中在部分DN上,而导致性能瓶颈。例如,在事实表上使用等值过滤条件时,将会导致扫描压力不均匀。 【关注】减少需要扫描的数据量。通过分区表的剪枝机制可以大幅减少数据的扫描量。 【关注】尽量减少随机I/O。通
可以避免数据倾斜。 【关注】将表的扫描压力均匀分散在各个DN上。避免扫描压力集中在部分DN上,而导致性能瓶颈。例如,在事实表上使用等值过滤条件时,将会导致扫描压力不均匀。 【关注】减少需要扫描的数据量。通过分区表的剪枝机制可以大幅减少数据的扫描量。 【关注】尽量减少随机I/O。通
tb_motor_vehicle列存表的分区扫描上。 已确认该表的分区键为createtime,而涉及的SQL中无任何createtime的筛选和过滤条件,基本可以确认是由于慢SQL的计划没有走分区剪枝,导致了全表扫描,对于185亿条数据量的表,全表扫描性能会很差。 处理方法 在慢SQL的
于导出数据库相关信息的工具,用户可以自定义导出一个数据库或其中的对象(模式、表、视图等)。支持导出的数据库可以是默认数据库postgres,也可以是自定义数据库。 gs_dump工具在进行数据导出时,其他用户可以访问集群数据库(读或写)。 gs_dump工具支持导出完整一致的数据
执行修复,打印详细信息,并存入日志: gds_check -t fix --host 192.168.1.100 --detail 父主题: 服务端工具
gds_ctl 背景信息 gds_ctl是一个批量控制GDS启停的脚本工具,一次执行可以在多个节点上启动/停止相同端口的GDS服务进程,并在启动时为每一个进程设置看护程序,用于看护GDS进程。 注意事项 执行脚本前需切换到GDS用户,必须在普通用户下执行脚本gds_ctl。 脚本需要在python
DisasterFineGrained.py DisasterFineGrained.py简介 命令行参考 父主题: 服务端工具
命令行参考 功能 主备集群配置互信并校验互信,方便主备集群容灾过程中免密执行命令、传送文件。 命令格式 python3 $GPHOME/script/ESLDoTrust.py -f <trustFile> [-l <logFile>] 参数说明 完整选项 缩写选项 数据类型 说明
业务查询有明显的区间范围特征。 查询数据可落到区间范围指定的分区内,这样才能通过分区剪枝,只扫描查询需要的分区,从而提升数据扫描效率,降低数据扫描的IO开销。 表数据量比较大。 小表扫描本身耗时不大,分区表的性能收益不明显,因此只建议对大表采取分区策略。列存储模式下因为每个列是单
MySQL配置 设置MySQL配置参数可在迁移MySQL数据库脚本时自定义迁移工具的行为。 打开config文件夹中的features-mysql.properties文件,并根据实际需要设置features-mysql.properties文件中的配置参数中的参数。 表1 features-mysql