检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GDS是GaussDB(DWS)提供的数据服务工具,通过和外表机制的配合,实现数据的高速导出。 安装配置和启动GDS操作步骤如下,详细内容请参见安装配置和启动GDS。 操作步骤 在使用GDS导入/导出数据前,请先参考教程:使用GDS从远端服务器导入数据中的步骤:“准备ECS作为GDS服务器”、“下载GDS工具包”。
控制优化器对仅索引扫描规划类型的使用。 enable_seqscan=on 控制优化器对顺序扫描规划类型的使用。完全消除顺序扫描是不可能的,但是关闭这个变量会让优化器在存在其他方法的时候优先选择其他方法。 enable_sort=on 控制优化器使用的排序步骤。该设置不可能完全消除明确的排序,但是关
将hdfs上的数据写入到管道文件而不需要占用额外的磁盘空间。 当用户导入前需要清洗数据时,用户可以根据自己的需求编写程序,将需要处理的数据流式实时的写入管道文件,完成导入的数据清洗工作。 当前版本暂不支持SSL模式下GDS导入,请勿以SSL方式使用GDS。 本章涉及的所有管道文件都是指Linux上的命名管道。
控制优化器对仅索引扫描规划类型的使用。 enable_seqscan=on 控制优化器对顺序扫描规划类型的使用。完全消除顺序扫描是不可能的,但是关闭这个变量会让优化器在存在其他方法的时候优先选择其他方法。 enable_sort=on 控制优化器使用的排序步骤。该设置不可能完全消除明确的排序,但是关
错误码: %s command cannot affect row a second time. 解决方案:请确保建议在同一命令中插入的行没有重复的约束值。 level: ERROR GS_231140071 错误码: abort transaction due to concurrent
使用GDS导出数据到远端服务器 关于GDS并行导出 规划导出数据 安装配置和启动GDS 创建GDS外表 执行导出数据 停止GDS GDS导出示例 父主题: 导出数据
)软件包解压缩自带的GDS进行安装配置和启动。在导入导出开始时,GaussDB(DWS)也会进行两端的版本一致性检测,不一致时会在屏幕上显示报错信息并终止对应操作。 GDS的版本号的查看办法为:在GDS工具的解压目录下执行如下命令。 gds -V 数据库版本的查看办法为:连接数据库后,执行如下SQL命令查看。
not determine which collation to use for %s function. 解决方案:使用COLLATE子句显式设置排序规则。 level: ERROR GS_226100025 错误码: invalid combination of date conventions
SHOW 功能描述 SHOW将显示当前运行时参数的数值。可以使用SET语句来设置这些参数。 注意事项 SHOW可以查看的某些参数是只读的,可以查看但不能设置它们的值。 语法格式 1 2 3 4 5 6 7 8 9 SHOW { configuration_parameter
SHOW 功能描述 SHOW将显示当前运行时参数的数值。可以使用SET语句来设置这些参数。 注意事项 SHOW可以查看的某些参数是只读的,但不能设置它们的值。 语法格式 1 2 3 4 5 6 7 8 9 SHOW { configuration_parameter
解决方案:请设置hashjoin_spill_strategy为0-2。 level: ERROR GS_232050001 错误码: LZ4 decompress failed when deserializing message. 解决方案:请确认网络接收到的数据是否正确。
使用GDS从远端服务器导入数据 关于GDS并行导入 准备源数据 安装配置和启动GDS 创建GDS外表 执行导入数据 处理导入错误 停止GDS GDS导入示例 父主题: 导入数据
场景三:MRS与DWS不在一个区域,需要通过“云连接(CC)”打通网络,请参见对应服务的用户指南。 场景四:MRS属于云下场景,需要通过“云专线(DC)”或“虚拟专用网络(VPN)”打通网络,请参见对应服务的用户指南。 从MRS导入数据到集群的流程 MRS集群上的数据准备 (可选)手动创建外部服务器 创建外表 执行数据导入
OPTION option 用于设置XML的解析方式。 取值范围:CONTENT(缺省)、DOCUMENT config_parameter 可设置的运行时参数的名称。可用的运行时参数可以使用SHOW ALL命令查看。 部分通过SHOW ALL查看的参数不能通过SET设置。如max_datanodes。
OPTION option 用于设置XML的解析方式。 取值范围:CONTENT(缺省)、DOCUMENT config_parameter 可设置的运行时参数的名称。可用的运行时参数可以使用SHOW ALL命令查看。 部分通过SHOW ALL查看的参数不能通过SET设置。如max_datanodes。
SQL历史记录”中设置的值。有关如何设置SQL历史查询数,请参见表1。查询数超过列表设置的值后,新执行的查询会覆盖较早的SQL历史查询。执行的查询会自动存储在列表中。 “历史执行SQL”对话框包含如下列: “锁定状态”:显示查询的置顶状态。锁定的查询将始终显示在顶部,即使列表已满,也不会从历史记录中删除。 “SQ
创建弹性云服务器ECS 参考《弹性云服务器用户指南》创建弹性云服务器,创建的规格可参见下表。 由于TPC-DS、TPC-H数据集占用空间较大,以TPC-DS 1000X和TPC-H 1000X为例,分别占用930GB和1100GB。请创建弹性云服务器时,根据需求添加数据盘,举例如下:
这些配置参数提供了影响查询优化器选择查询规划的原始方法。如果优化器为特定的查询选择的缺省规划并不是最优的,可以通过使用这些配置参数强制优化器选择一个不同的规划来临时解决这个问题。更好的方法包括调节优化器开销常量、手动运行ANALYZE、增加配置参数default_statistics_target的值、增加使用ALTER
使用GDS工具将数据从数据库导出到普通文件系统中,适用于高并发、大量数据导出的场景。 当前版本的GDS支持从数据库导出到管道文件,该功能使GDS的导出更加灵活多变。 当GDS用户的本地磁盘空间不足时: 通过管道文件将从GDS导出的数据进行压缩减少磁盘空间。 通过管道直接将导出来的数据放到hdfs服务器上。 当用户导出前需要清洗数据时:
prepare命令需在主集群的主节点上执行。 表1 设置GUC参数 设置集群 参数 参数说明 取值范围 设置值 主集群/备集群 enable_metadata_tracking 在细粒度容灾的主集群上,用于追踪细粒度容灾相关对象的元数据(包括DDL、DCL)变更,用于向备集群同步变更的元数据。 布尔型: