搜索_华为云

MRS集群上的数据准备 - 数据仓库服务 GaussDB(DWS)

MRS集群上的数据准备从MRS导入数据到GaussDB(DWS)集群之前，假设您已经完成了以下准备工作：已创建MRS集群。在MRS集群上创建了Hive/Spark ORC表，且表数据已经存储到该表对应的HDFS路径上。如果您已经完成上述准备，则可以跳过本章节。为方便起见，以在MRS集群上创建Hive

帮助中心 > 数据仓库服务 GaussDB(DWS) > 数据迁移与同步 > 导入数据 > 从MRS导入数据到集群
创建GDS外表 - 数据仓库服务 GaussDB(DWS)

转换规则转换后入库，还是报错中止导入。取值范围：true/on，false/off。参数为true/on，则导入时遇到非法字符进行容错处理，非法字符转换后入库，不报错，不中断导入。参数为false/off，导入时遇到非法字符进行报错，中断导入。缺省值：false/off。

帮助中心 > 数据仓库服务 GaussDB(DWS) > 数据迁移与同步 > 导入数据 > 使用GDS从远端服务器导入数据
使用ODBC连接 - 数据仓库服务 GaussDB(DWS)

程序可以在华为云平台环境的弹性云服务器中，或者互联网环境连接数据库。 ODBC接口的使用方法，请自行查阅官方文档。前提条件已下载Linux版本的ODBC驱动包“dws_x.x.x_odbc_driver_for_xxx.zip”和Windows版本的ODBC驱动包“dws_o

帮助中心 > 数据仓库服务 GaussDB(DWS) > 用户指南 > 连接GaussDB(DWS)集群 > 使用第三方库连接GaussDB(DWS)集群 > 使用JDBC和ODBC连接集群
gds_uninstall - 数据仓库服务 GaussDB(DWS)

执行脚本前需设置环境变量，可参考《开发指南》中“导入数据>通过外表并行导入>安装配置和启动GDS”章节。脚本需要在python 3环境下运行。必须在root用户下执行脚本gds_uninstall。必须包含--host、-U参数。目前不支持跨平台的卸载操作。 --host参数指定的所

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 工具指南 > 服务端工具
手动创建外部服务器 - 数据仓库服务 GaussDB(DWS)

hdfscfgpath=/MRS/8f79ada0-d998-4026-9020-80d6de2692ca,type=hdfs} (1 row) 父主题：从MRS导入数据到集群

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 数据迁移与同步 > 导入数据 > 从MRS导入数据到集群
GDS导入示例 - 数据仓库服务 GaussDB(DWS)

数据文件是否包含标题行（header）为默认值false，即导入时数据文件第一行被识别为数据。设置导入容错性如下所示：允许出现的数据格式错误个数（PER NODE REJECT LIMIT 'value'）为unlimited，即接受导入过程中所有数据格式错误。将数据导入过程中出现的数据格式错误信息（LOG

帮助中心 > 数据仓库服务 GaussDB(DWS) > 工具指南 > GDS
使用COPY FROM导入时报错“invalid byte sequence for encoding "UTF8": 0x00” - 数据仓库服务 GaussDB(DWS)

0'）的字符串，需在导入前去掉字符串中的'\0'。处理方法用sed命令替换0x00后，即可成功导入。 1 sed -i 's/\x00//g;' file 参数说明： -i表示在原文件直接替换。 s/表示替换。 /g表示全局替换。父主题：数据导入/导出

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 故障排除 > 数据导入/导出
通过CDM将MySQL数据导入GaussDB(DWS)时出现字段超长，数据同步失败 - 数据仓库服务 GaussDB(DWS)

通过CDM将MySQL数据导入GaussDB(DWS)时出现字段超长，数据同步失败问题现象 MySQL 5.x版本字段长度varchar(n)，用CDM同步数据到GaussDB(DWS)，同样设置长度为varchar(n) ，但是会出现字段超长，数据同步失败的问题。原因分析 MySQL5

帮助中心 > 数据仓库服务 GaussDB(DWS) > 故障排除 > 数据导入/导出
使用外表功能实现GaussDB(DWS)集群间数据迁移 - 数据仓库服务 GaussDB(DWS)

使用GDS导入数据源通过外表导入远端DWS数据准备工作已注册华为账号并开通华为云，具体请参见注册华为账号并开通华为云，账号不能处于欠费或冻结状态。创建ECS 参见自定义购买弹性云服务器购买。购买后，参见登录Linux弹性云服务器进行登录。创建ECS过程中，注意选择与后续的DWS集

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 最佳实践 > 导入导出
CREATE FOREIGN TABLE (OBS导入导出) - 数据仓库服务 GaussDB(DWS)

x。在实际导入导出数据时，location参数使用建议如下：导入时“location”建议指定到具体文件名。如果仅指定到OBS桶或目录，则会导入其中的所有文本文件。当数据格式不正确时，则会报错。如果设置了容错，则容错表可能导入大量数据。支持OBS单桶多文件导入，根据文件名前缀进行匹配，匹配到的文件都会被导入。

帮助中心 > 数据仓库服务 GaussDB(DWS) > SQL语法参考(9.1.0.x) > DDL语法
快速创建GaussDB(DWS)集群并导入数据进行查询 - 数据仓库服务 GaussDB(DWS)

存储容量：20G/节点数据源：OBS桶的csv数据集群版本：8.1.3.x 操作流程表1 操作流程操作步骤说明准备工作注册华为账号并开通华为云，实名认证，为账户充值以及规划和创建VPC、子网资源。步骤一：创建GaussDB(DWS)集群创建3节点的GaussDB(D

帮助中心 > 数据仓库服务 GaussDB(DWS) > 快速入门
GDS实践指南 - 数据仓库服务 GaussDB(DWS)

保证单文件导入速率最大化。提前做好服务部署规划，数据服务器上，建议一个Raid只布1~2个GDS。GDS跟DN的数据比例建议在1:3至1:6之间。一台加载机的GDS进程不宜部署太多，千兆网卡部署1个GDS进程即可，万兆网卡机器建议部署不大于4个进程。提前对GDS导入导出的数据

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 最佳实践 > 导入导出
使用EXTERNAL SCHEMA跨集群访问HiveMetaStore元数据 - 数据仓库服务 GaussDB(DWS)

传至OBS桶，再通过OBS桶导入Hive，并由txt存储表导入ORC存储表。创建MRS数据源连接。创建外部服务器。创建EXTERNAL SCHEMA。通过EXTERNAL SCHEMA对Hive表进行导入或者读取操作。创建MRS集群登录华为云控制台，选择“大数据 > MapReduce服务”。

帮助中心 > 数据仓库服务 GaussDB(DWS) > 最佳实践 > 导入导出
迁移OBS桶数据至GaussDB(DWS)集群 - 数据仓库服务 GaussDB(DWS)

本教程通过演示将样例数据上传OBS，以及将OBS的数据导入GaussDB(DWS)的目标表中，让您快速掌握如何从OBS导入数据到GaussDB(DWS)集群的完整过程。 GaussDB(DWS)支持通过外表将OBS上TXT、CSV、ORC、PARQUET、CARBONDATA以及JSON格式的数据导入到集群进行查询。

帮助中心 > 数据仓库服务 GaussDB(DWS) > 最佳实践 > 导入导出
从GaussDB(DWS)集群导出ORC数据到MRS集群 - 数据仓库服务 GaussDB(DWS)

准备环境已创建DWS集群，需确保MRS和DWS集群在同一个区域、可用区、同一VPC子网内，确保集群网络互通。创建MRS分析集群登录华为云控制台，选择“大数据 > MapReduce服务”，单击“购买集群”，选择“自定义购买”，填写软件配置参数，单击“下一步”。表1 软件配置

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 最佳实践 > 导入导出
如何使用GaussDB(DWS)的\copy导入导出？ - 数据仓库服务 GaussDB(DWS)

如何使用GaussDB(DWS)的\copy导入导出？由于云上GaussDB(DWS)是全托管服务，用户无法登录后台，无法使用copy进行导入导出文件，所以云上将copy语法禁掉。云上推荐将数据文件放到obs上，使用obs外表进行入库，如果需要使用copy导入导出数据，可以参考如下方法：将数据文件放到客户端的机器上。

帮助中心 > 数据仓库服务 GaussDB(DWS) > 常见问题 > 数据迁移
使用gs_restore导入数据 - 数据仓库服务 GaussDB(DWS)

gs_restore工具在导入时，允许用户选择需要导入的内容，并支持在数据导入前对等待导入的内容进行排序。操作步骤 gs_restore默认是以追加的方式进行数据导入。为避免多次导入造成数据异常，在进行导入时，建议使用“-e”和“-c”参数，即导入前删除已存在于待导入数据库中的数据库对

 帮助中心 > 数据仓库服务 GaussDB(DWS) > 数据迁移与同步 > 元数据迁移
导入过程存储倾斜即时检测 - 数据仓库服务 GaussDB(DWS)

导入过程存储倾斜即时检测导入过程中对DN导入行数进行统计，导入完成后计算倾斜率，超过一定阈值时，立即进行告警。倾斜率通过（DN导入行数最大值-DN导入行数最小值）/导入总行数计算。目前，只支持INSERT和COPY导入。必须设置enable_stream_operator=o

帮助中心 > 数据仓库服务 GaussDB(DWS) > 最佳实践 > 数据库管理 > 数据倾斜查询优秀实践
CREATE FOREIGN TABLE (GDS导入导出) - 数据仓库服务 GaussDB(DWS)

取值范围：normal，pipe。缺省为normal。参数为normal，表示导入或者导出的文件类型为普通文件。参数为pipe，表示导入或者导出的文件类型为命名管道文件。 file_sequence 用于多任务GDS外表并行导入，提升单个文件的导入性能。该参数仅供数据导入使用。格式为file_sequence '文件被拆分的总数-当前分片'

帮助中心 > 数据仓库服务 GaussDB(DWS) > SQL语法参考(8.1.3.x) > DDL语法
CREATE FOREIGN TABLE (GDS导入导出) - 数据仓库服务 GaussDB(DWS)

file_sequence 用于多任务GDS外表并行导入，提升单个文件的导入性能。该参数仅供数据导入使用。格式为file_sequence '文件被拆分的总数-当前分片' 。例如： file_sequence '3-1' 表示导入的文件在逻辑上被拆分成3份，当前外表导入的数据为第一个分片上的数据。 file_sequence

帮助中心 > 数据仓库服务 GaussDB(DWS) > SQL语法参考(9.1.0.x) > DDL语法

总条数： 840

上一页
1
2
3
4
5
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS集群上的数据准备 - 数据仓库服务 GaussDB(DWS)

创建GDS外表 - 数据仓库服务 GaussDB(DWS)

使用ODBC连接 - 数据仓库服务 GaussDB(DWS)

gds_uninstall - 数据仓库服务 GaussDB(DWS)

手动创建外部服务器 - 数据仓库服务 GaussDB(DWS)

GDS导入示例 - 数据仓库服务 GaussDB(DWS)

使用COPY FROM导入时报错“invalid byte sequence for encoding "UTF8": 0x00” - 数据仓库服务 GaussDB(DWS)

通过CDM将MySQL数据导入GaussDB(DWS)时出现字段超长，数据同步失败 - 数据仓库服务 GaussDB(DWS)

使用外表功能实现GaussDB(DWS)集群间数据迁移 - 数据仓库服务 GaussDB(DWS)

CREATE FOREIGN TABLE (OBS导入导出) - 数据仓库服务 GaussDB(DWS)

快速创建GaussDB(DWS)集群并导入数据进行查询 - 数据仓库服务 GaussDB(DWS)

GDS实践指南 - 数据仓库服务 GaussDB(DWS)

使用EXTERNAL SCHEMA跨集群访问HiveMetaStore元数据 - 数据仓库服务 GaussDB(DWS)

迁移OBS桶数据至GaussDB(DWS)集群 - 数据仓库服务 GaussDB(DWS)

从GaussDB(DWS)集群导出ORC数据到MRS集群 - 数据仓库服务 GaussDB(DWS)

如何使用GaussDB(DWS)的\copy导入导出？ - 数据仓库服务 GaussDB(DWS)

使用gs_restore导入数据 - 数据仓库服务 GaussDB(DWS)

导入过程存储倾斜即时检测 - 数据仓库服务 GaussDB(DWS)

CREATE FOREIGN TABLE (GDS导入导出) - 数据仓库服务 GaussDB(DWS)

CREATE FOREIGN TABLE (GDS导入导出) - 数据仓库服务 GaussDB(DWS)

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线