检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Windows 7专业版 64位Java 1.8 JDK(不兼容) 请安装32位Java 1.8。 安装32位Java 1.8。 支持Data Studio的最低Java版本为1.8。使用Data Studio前需安装Java 1.8。 安装与操作系统位数对应的Java 1.8。 您试图在如下环境运行64位Data
Studio服务创建GaussDB(DWS)外表时不支持中文,如何处理 问题现象 使用DataArts Studio服务创建GaussDB(DWS)的OBS外表,并且在创建外表语句中指定OBS文件编码格式是UTF-8,但是导入数据时报错,如何处理? 原因分析 存储在OBS中的源文件含有非UTF-8的数据。
在导入前后验证数据文件 从OBS导入数据时,首先将您的文件上传到OBS存储桶中,建议您列出存储桶的内容,然后验证该存储桶是否包含所有正确的文件并且仅包含这些文件。 在完成导入操作后,请使用SELECT查询语句验证所需文件是否已导入。 OBS导入导出数据时,不支持中文路径。 使用GDS导入数据
连接的数据库。当数据源为OBS时为必选字段。 响应参数 表3 响应Body参数 参数 参数类型 描述 id String 数据源配置ID。 job_id String 创建数据源的任务ID。 请求示例 创建名为test154的OBS数据源,用户名为“DWSAccessOBS”,连接gaussdb数据库:
提供对之前版本的前向兼容。原PG_JOB_PROC系统表已经和原PG_JOB系统表一同并入当前版本的PG_JOBS系统表,关于PG_JOBS系统表的描述详见PG_JOBS。 表1 PG_JOB_PROC字段 名字 类型 描述 job_id bigint 作业ID。 what text
PG_LIFECYCLE_DATA_DISTRIBUTE PG_LIFECYCLE_DATA_DISTRIBUTE视图查询OBS多温表中冷热数据分布情况。 表1 PG_LIFECYCLE_DATA_DISTRIBUTE字段 名称 类型 描述 schemaname name 模式名。
PG_LIFECYCLE_DATA_DISTRIBUTE PG_LIFECYCLE_DATA_DISTRIBUTE视图查询OBS多温表中冷热数据分布情况。 表1 PG_LIFECYCLE_DATA_DISTRIBUTE字段 名称 类型 描述 schemaname name 模式名。
仅8.2.0及以上版本集群支持 数据迁移 数据迁移围绕GaussDB(DWS),提供了简单易用的迁移能力及多种数据源到DWS的集成能力,降低用户数据源迁移和集成的复杂性,是一种高效易用的数据集成服务。目前数据源支持从Kafka、MRS源端迁移至GaussDB(DWS)目的端。 发布区域:全部
使用CDM迁移MySQL数据至GaussDB(DWS)集群 本入门提供通过云数据迁移服务CDM将MySQL数据批量迁移到GaussDB(DWS)集群的指导。 本入门的基本内容如下所示: 迁移前数据检查 创建GaussDB(DWS)集群 创建CDM集群 创建连接 新建作业和迁移 迁移后数据一致性验证
提供对之前版本的前向兼容。原PG_JOB_PROC系统表已经和原PG_JOB系统表一同并入当前版本的PG_JOBS系统表,关于PG_JOBS系统表的描述详见PG_JOBS。 表1 PG_JOB_PROC字段 名字 类型 描述 job_id bigint 作业ID。 what text
说明 准备工作 注册华为账号并开通华为云,实名认证,为账户充值以及规划和创建VPC、子网资源。 步骤一:创建GaussDB(DWS)集群 创建3节点的GaussDB(DWS)集群,配置集群节点、存储容量、集群版本号等信息。 步骤二:上传数据到OBS桶 创建OBS桶,并将本地的csv格式数据上传到OBS桶。
数据迁移 GaussDB(DWS)的OBS外表与GDS外表支持的数据格式有什么区别? 数据如何存储到GaussDB(DWS)? GaussDB(DWS)可以存储多少业务数据? 如何使用GaussDB(DWS)的\copy导入导出? 如何实现GaussDB(DWS)不同编码库之间数据容错导入
以root用户登录待安装GDS的数据服务器,创建存放GDS工具包的目录。 mkdir -p /opt/bin/dws 将GDS工具包上传至上一步所创建的目录中。 以上传SUSE Linux版本的工具包为例 ,将GDS工具包“dws_client_8.x.x_suse_x64.zip”上传至上一步所创建的目录中。
); 恢复Hudi同步任务 查询Hudi任务,获取task_id,恢复Hudi任务。 1 SELECT pg_task_resume('task_id'); 示例: 恢复task_id为64479410-a04c-0700-d150-3037d700fffe的同步任务。 1 SELECT
导出数据 导出数据到OBS 导出ORC数据到MRS 使用GDS导出数据到远端服务器
恢复快照到原集群 操作场景 恢复到原集群时,可以指定快照恢复到本集群。通常在集群故障或者需要将数据回滚到指定快照版本时,用户使用该功能。 该功能仅8.1.3.200及以上集群版本支持。 该功能目前支持备份设备为OBS的快照。 快照状态为“可用”时,用户才可以进行快照恢复。 不支持恢复逻辑集群与资源池到当前集群。
导入数据 从OBS并行导入数据 使用GDS从远端服务器导入数据 从MRS导入数据到集群 从GaussDB(DWS)集群导入数据到新集群 基于GDS的跨集群互联互通 使用开源Kettle导入数据 使用gsql元命令\COPY导入数据 使用COPY FROM STDIN导入数据
参数说明:控制是否打开文件缓存。该参数受enable_aio_scheduler和obs_worker_pool_size的前置控制;只有在enable_aio_scheduler=on以及obs_worker_pool_size>=4的前提下,此参数为on才会生效。 参数类型:USERSET
入数据。 CopyManager的继承关系 CopyManager类位于org.postgresql.copy Package中,继承自java.lang.Object类,该类的声明如下: public class CopyManager extends Object 构造方法 public
手动创建外部服务器 创建外表语法(CREATE FOREIGN TABLE (SQL on Hadoop or OBS))中,需指定一个与MRS数据源连接相关联的外部服务器。 当您通过GaussDB(DWS)管理控制台创建MRS数据源连接时,数据库管理员dbadmin会在默认数据