检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
并发度不太高的场景。 从MRS导入数据,将MRS作为ETL。 通过COPY FROM STDIN方式导入数据。 通过COPY FROM STDIN命令写数据到一个表。 使用GDS从远端服务器导入数据到DWS。 当用户需要将普通文件系统(例如,弹性云服务器)中的数据文件导入到DWS时,可以使用DWS提供的GDS导入数据的功能。
默认值:16MB -t worker_num 设置导入导出工作并发线程数目。 取值范围:0<worker_num<=200,正整数 默认值:8 推荐值:普通文件导入导出场景取值:CPU核数*2;管道文件导入导出场景取值:64。 当管道文件导入导出场景并发较大时,该值应不低于业务并发数。
PGXC_BULKLOAD_PROGRESS PGXC_BULKLOAD_PROGRESS显示导入业务的执行进度,仅支持GDS普通文件导入业务。需要有系统管理员权限才可以访问此视图 表1 PGXC_BULKLOAD_PROGRESS字段 名称 类型 描述 session_id bigint
PGXC_BULKLOAD_PROGRESS PGXC_BULKLOAD_PROGRESS显示导入业务的执行进度,仅支持GDS普通文件导入业务。需要有系统管理员权限才可以访问此视图。 表1 PGXC_BULKLOAD_PROGRESS字段 名称 类型 描述 session_id bigint
"unimplemented bulkload mode" SQLSTATE: XX000 错误原因:不支持的导入模式。 解决办法:在normal/shared/private中选择一个有效的导入模式。 GAUSS-01262: "relative path not allowed for writable
ONLY foreign table" SQLSTATE: 42601 错误原因:compatible_illegal_chars导入参数只能用于导入不能用于导出。 解决办法:对于导出操作去除compatible_illegal_chars参数。 GAUSS-04552: "DATE_FORMAT
查看数据倾斜状态 操作场景 数据倾斜会造成查询表性能下降。对于记录数超过千万条的表,建议在执行全量数据导入前,先导入部分数据,以进行数据倾斜检查和调整分布列,避免导入大量数据后发现数据倾斜,调整成本高。 背景信息 GaussDB(DWS)是采用Shared-nothing架构的MPP(Massive
非数据格式错误 对于非数据格式错误,一旦发生将导致整个数据导入失败。您可以根据执行数据导入过程中,界面提示的错误信息,帮助定位问题,处理错误表。 处理数据导入错误 根据获取的错误信息,请对照下表,处理数据导入错误。 表2 处理数据导入错误 错误信息 原因 解决办法 missing data
么区别? OBS与GDS外表支持格式文件区别如下: OBS导入支持ORC、TEXT、JSON、CSV、CARBONDATA、PARQUET文件格式,导出支持ORC、CSV、TEXT文件格式,缺省值为TEXT。 GDS导入导出支持的文件格式:TEXT、CSV和FIXED,缺省值为TEXT。
is %d" SQLSTATE: XX000 错误原因:收到了非法的GDS交互。 解决办法:请检查GDS外表对应的导入文件中是否存在非法数据并对文件进行数据清洗后再次导入。 GAUSS-04622: "%s cannot be executed when enable_show_any_tuples
当前集群上各个节点已经执行结束的导入导出类业务的历史执行情况(包括互联互通集群地址、导入导出业务类型、DN上落盘的最大、最小以及总和的行数与字节数等),从而可以获取导入导出类业务执行的历史信息,辅助进行性能问题排查。 该视图不会记录异常中断的导入导出作业,数据直接从系统表GS_W
参数说明:当数据库在数据导入行存表时,主机与备机的数据同步方式可以进行选择。 参数类型:USERSET 取值范围:布尔型 on表示导入数据行存表时主备数据采用数据页的方式进行同步。当replication_type参数为1时,不允许设置为on。 off表示导入数据行存表时主备数据采用日志(Xlog)方式进行同步。
由于管道“读取即删除”的特点,需确保导入或导出过程中除GDS程序外无其他程序读取管道文件,避免导入过程中数据丢失或者任务报错及导出的文件内容混乱。 不支持对具有相同Location的外表并发导入导出,即GDS的多个线程同时读取管道文件或者同时写入管道文件。 GDS的单个导入导出任务只识别一个管道
参数说明:当数据库在数据导入行存表时,主机与备机的数据同步方式可以进行选择。 参数类型:USERSET 取值范围:布尔型 on表示导入数据行存表时主备数据采用数据页的方式进行同步。当replication_type参数为1时,不允许设置为on。 off表示导入数据行存表时主备数据采用日志(Xlog)方式进行同步。
查询语句。 address text 当前导入导出外表的location。 query_start timestamp with time zone 导入/导出开始时间。 total_bytes bigint 待处理数据的总大小。 仅GDS普通文件导入时,且该行记录来自CN节点才会显示,否则为空。
查询语句。 address text 当前导入导出外表的location。 query_start timestamp with time zone 导入/导出开始时间。 total_bytes bigint 待处理数据的总大小。 仅GDS普通文件导入时,且该行记录来自CN节点才会显示,否则为空。
获取当前在第几行。 获取结果集中的数据 ResultSet对象提供了丰富的方法,以获取结果集中的数据。获取数据常用的方法如表4所示,其他方法请参考JDK官方文档。 表4 ResultSet对象的常用方法 方法 描述 int getInt(int columnIndex) 按列标获取int型数据。
建立数据库连接失败 Check that the hostname and port are correct and that the postmaster is accepting TCP/IP connections. 问题分析:客户端与服务端网络不通、端口错误或待连接CN异常。
更新MRS数据源配置 操作场景 MRS的HDFS集群参数配置变更时,可能造成GaussDB(DWS)集群无法从HDFS集群导入数据。使用HDFS集群导入数据前,需要执行MRS数据源配置的更新操作。 前提条件 GaussDB(DWS)集群已创建MRS数据源连接。 对系统的影响 更新
获取当前在第几行。 获取结果集中的数据 ResultSet对象提供了丰富的方法,以获取结果集中的数据。获取数据常用的方法如表4所示,其他方法请参考JDK官方文档。 表4 ResultSet对象的常用方法 方法 描述 int getInt(int columnIndex) 按列标获取int型数据。