-
数据开发操作 - 数据仓库服务 GaussDB(DWS)
、用户角色和表空间。数据库包括系统模式、用户模式和外部服务器,其中系统模式和用户模式是根据OID来区分,系统模式不能更改删除,用户模式包括普通/分区表、外表、视图、函数、序列和同义词。表包括列、约束、索引和分区以及触发器,提供LIST和INFO接口查询列表和具体元数据详情。 目前
-
查询和索引统计收集器 - 数据仓库服务 GaussDB(DWS)
查询和索引统计收集器 查询和索引统计收集器负责收集数据库系统运行中的统计数据,如在一个表和索引上进行了多少次插入与更新操作、磁盘块的数量和元组的数量、每个表上最近一次执行清理和分析操作的时间等。可以通过查询系统视图pg_stats和pg_statistic查看统计数据。下面的参数设置服务器范围内的统计收集特性。
-
向量化执行引擎 - 数据仓库服务 GaussDB(DWS)
large. Build is %s. 解决方案:请对语句执行ANALYZE并进行调优,以获得更好的计划。 level: LOG 父主题: 执行器
-
查询和索引统计收集器 - 数据仓库服务 GaussDB(DWS)
查询和索引统计收集器 查询和索引统计收集器负责收集数据库系统运行中的统计数据,如在一个表和索引上进行了多少次插入与更新操作、磁盘块的数量和元组的数量、每个表上最近一次执行清理和分析操作的时间等。可以通过查询系统视图pg_stats和pg_statistic查看统计数据。下面的参数设置服务器范围内的统计收集特性。
-
处理结果集 - 数据仓库服务 GaussDB(DWS)
定的行。定位方法如表2所示。 表2 在结果集中定位的方法 方法 描述 next() 把ResultSet向下移动一行。 previous() 把ResultSet向上移动一行。 beforeFirst() 把ResultSet定位到第一行之前。 afterLast() 把ResultSet定位到最后一行之后。
-
存储过程 - 数据仓库服务 GaussDB(DWS)
DB(DWS)中,这个程序就是存储过程。 存储过程是SQL,PL/SQL,Java语句的组合。存储过程使执行商业规则的代码可以从应用程序中移动到数据库。从而,代码存储一次能够被多个程序使用。 存储过程的创建及调用办法请参考CREATE PROCEDURE。 PL/pgSQL语言函
-
分布式执行框架 - 数据仓库服务 GaussDB(DWS)
GS_235200001 错误码: Skewness occurs. 解决方案:请检查数据分布或修改警告阈值。 level: WARNING 父主题: 执行器
-
数据开发设置 - 数据仓库服务 GaussDB(DWS)
设置描述 编辑器 主要是对编辑器主题部分编写SQL的基础设置,比如默认选择自动联想,可补全一些关键字;选择字段提示,在写TABLE表时联想到里面的字段等。 操作栏 对面板上按钮的显示进行设置,可以对面板上的按钮去勾选,只保留关键的几个按钮,让界面更清晰简洁。 快捷键 在编辑器上操作时可以使用快捷键来快速编写SQL。
-
使用GDS导出数据到远端服务器 - 数据仓库服务 GaussDB(DWS)
使用GDS导出数据到远端服务器 关于GDS并行导出 规划导出数据 安装配置和启动GDS 创建GDS外表 执行导出数据 停止GDS GDS导出示例 父主题: 导出数据
-
使用GDS从远端服务器导入数据最佳实践 - 数据仓库服务 GaussDB(DWS)
购买Linux弹性云服务器的操作步骤,请参见《弹性云服务器快速入门》中的自定义购买弹性云服务器。购买后,请参见登录Linux弹性云服务器进行登录。 ECS操作系统必须是GDS工具包所支持的操作系统。 ECS与DWS处于同一区域、同一虚拟私有云和子网。 ECS安全组规则需放通DWS集群的访问,即安全组入规则:
-
创建DWS 2.0集群 - 数据仓库服务 GaussDB(DWS)
认配置”,以下参数将使用它们的默认值。 开启后可以设置自动快照的保留天数以及修改当前集群使用的备份设备,各参数配置原则如表5所示。 表5 自动快照参数说明 参数名 参数解释 备份设备 下拉框,支持OBS和NFS。 备份NFS文件系统地址(NFS参数) NFS的共享地址IP。填写弹
-
使用GDS从远端服务器导入数据 - 数据仓库服务 GaussDB(DWS)
使用GDS从远端服务器导入数据 关于GDS并行导入 准备源数据 安装配置和启动GDS 创建GDS外表 执行导入数据 处理导入错误 停止GDS GDS导入示例 父主题: 导入数据
-
规划导出数据 - 数据仓库服务 GaussDB(DWS)
使用GDS从集群导出到数据之前,要提前准备需要导出的数据,并规划导出的路径。 规划导出路径 Remote模式 以root用户登录GDS数据服务器,创建导出的数据文件存放目录“/output_data”。 1 mkdir -p /output_data (可选)创建用户及所属的用户组
-
停止GDS - 数据仓库服务 GaussDB(DWS)
停止GDS 操作场景 待导入数据成功后,停止GDS。 操作步骤 以gds_user用户登录安装GDS的数据服务器。 请根据启动GDS的方式,选择停止GDS的方式。 若用户使用“gds”命令启动GDS,请使用以下方式停止GDS。 执行如下命令,查询GDS进程号。 ps -ef|grep
-
GDS导入示例 - 数据仓库服务 GaussDB(DWS)
GDS导入示例 多数据服务器并行导入 规划数据服务器与集群处于同一内网,数据服务器IP为192.168.0.90和192.168.0.91。数据源文件格式为CSV。 以root用户登录每台GDS数据服务器,在两台数据服务器上,分别创建数据文件存放目录“/input_data”。以下以IP为192
-
准备源数据 - 数据仓库服务 GaussDB(DWS)
入库数据的服务器为数据服务器。此时,只需检测以确认数据服务器和GaussDB(DWS)集群能够正常通信,并查看和记录数据在数据服务器上的存放目录备用。 如果待入库数据还没有就绪,则请先参考如下步骤,将数据上传到数据服务器上。 操作步骤 以root用户登录数据服务器。 创建数据文件存放目录“/input_data”。
-
停止GDS - 数据仓库服务 GaussDB(DWS)
GDS是GaussDB(DWS)提供的数据服务工具,通过和外表机制的配合,实现数据的高速导出。 详细内容请参见停止GDS。 父主题: 使用GDS导出数据到远端服务器
-
创建GDS外表 - 数据仓库服务 GaussDB(DWS)
示例:创建GDS导出外表foreign_tpcds_reasons,待导出数据格式为CSV,用于接收数据服务器上的数据。 其中设置的导出模式信息如下所示: 规划数据服务器与集群处于同一内网,数据服务器IP为192.168.0.90,待导出的数据文件格式为CSV,选择并行导出模式为Remote模式。
-
执行导出数据 - 数据仓库服务 GaussDB(DWS)
执行导出数据 前提条件 需要确保每一个CN和DN所在服务器到GDS服务器的IP和端口是互通的。 导出操作语法 执行数据导出语法: 1 INSERT INTO [foreign table 表名] SELECT * FROM [源表名]; 编写批处理任务脚本,实现并发批量导出数
-
执行导入数据 - 数据仓库服务 GaussDB(DWS)
查和调整分布列,避免导入大量数据后发现数据倾斜,调整成本高。 前提条件 GDS服务器和GaussDB(DWS)集群之间网络可以互通。 需要创建一个弹性云服务器作为GDS服务器。 创建的弹性云服务器与GaussDB(DWS)集群应处于同一区域、同一虚拟私有云和子网。 操作步骤 在G