检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
模式级的内容,包含模式的数据和定义。用户可通过灵活的自定义方式导出模式内容,不仅支持选定一个模式或多个模式的导出,还支持排除一个模式或者多个模式的导出。可根据需要自定义导出如下信息: 导出模式全量信息,包含数据和对象定义。 仅导出数据,即模式包含表中的数据,不包含对象定义。 仅导
通过查询筛选出的行的某些部分,窗口调用函数实现了类似于聚集函数的功能,所以聚集函数也可以作为窗口函数使用。 窗口函数可以扫描所有的行,并同时将原始数据和聚集分析结果同时显示出来。 注意事项 列存表目前只支持窗口函数rank(expression)和row_number(expressio
支持OBS内表方式存储冷数据。 增加表级analyze赋权。 支持国密算法SM4 CBC模式。 支持WDR报告。 基表允许直接修改,相关视图支持自动更新和级联更新。 审计日志增强:增加事务、运维操作等记录;DDL只记录一遍;过滤数据库内部操作等。 数据脱敏增强:支持自定义数据脱敏规则。 数据库用户密码到期强制更改后才能登录。
gs_dump和gs_dumpall工具支持导出完整一致的数据。例如,T1时刻启动gs_dump导出A数据库,或者启动gs_dumpall导出整个集群数据库,那么导出数据结果将会是T1时刻A数据库或者该集群数据库的数据状态,T1时刻之后对A数据库或集群数据库的修改不会被导出。 gs_dump和gs
GaussDB(DWS)提供了数据服务工具GDS来帮助分发待导入的用户数据及实现数据的高速导入。GDS需部署到数据服务器上。 数据量大,数据存储在多个服务器上时,在每个数据服务器上安装配置、启动GDS后,各服务器上的数据可以并行入库。GDS在各台数据服务器上的安装配置和启动方法相同,本节以一台服务器为例进行说明。
停止GDS 操作场景 待导入数据成功后,停止GDS。 操作步骤 以gds_user用户登录安装GDS的数据服务器。 请根据启动GDS的方式,选择停止GDS的方式。 若用户使用“gds”命令启动GDS,请使用以下方式停止GDS。 执行如下命令,查询GDS进程号。 ps -ef|grep
创建外部服务器 OBS创建外部服务器请参见创建外部服务器。 HDFS创建外部服务器请参见手动创建外部服务器。 父主题: 导出ORC数据到OBS
删除数据库失败,提示有session正在连接 问题现象 删除数据库失败,提示有session正在连接。 原因分析 删除数据库时可能当前仍有session正在连接数据库,或者有session在不停地连接该数据库,故删除数据库失败。需要查看数据库中的session,检查是否仍有ses
如何实现GaussDB(DWS)不同编码库之间数据容错导入 要实现从数据库A(UTF8编码)至数据库B(GBK编码)的数据导入,常规方法导入数据时会出现字符集编码不匹配的错误,导致数据无法导入。 针对小批量数据导入的场景,可以通过\COPY命令来完成,具体方法如下: 创建数据库A和B,其中数据库A的编码格式为UTF8,数据库B的编码格式为GBK。
导出全局对象 GaussDB(DWS)支持使用gs_dumpall工具导出所有数据库公共的全局对象,包含数据库用户和组,表空间及属性(例如:适用于数据库整体的访问权限)信息。 操作步骤 准备ECS作为gsql客户端主机。 请参见下载客户端下载gsql客户端,并使用SSH文件传输工
从GaussDB(DWS)集群导出ORC数据到MRS集群 GaussDB(DWS)数据库支持通过HDFS外表导出ORC格式数据至MRS,通过外表设置的导出模式、导出数据格式等信息来指定导出的数据文件,利用多DN并行的方式,将数据从GaussDB(DWS)数据库导出到外部,存放在HDFS文件系统上,从而提高整体导出性能。
示例:通过本地文件导入导出数据 在使用JAVA语言基于GaussDB(DWS)进行二次开发时,可以使用CopyManager接口,通过流方式,将数据库中的数据导出到本地文件或者将本地文件导入数据库中,文件格式支持CSV、TEXT等格式。 样例程序如下,执行时需要加载GaussDB(DWS)
GaussDB(DWS)的磁盘总容量统计:以3个数据节点为例,假设每个节点320G,总容量为960G。当存入一个1G的数据,GaussDB(DWS)因为副本机制会将这1G的数据在两个节点中都各存一份,共占2G的空间,如果再加上元数据、索引等,实际1G的数据,存入DWS后占用的空间不止2G。所
安装配置和启动GDS GDS是GaussDB(DWS)提供的数据服务工具,通过和外表机制的配合,实现数据的高速导出。 详细内容请参见安装配置和启动GDS。 父主题: 使用GDS导出数据到远端服务器
创建外部服务器 HDFS创建外部服务器请参见手动创建外部服务器。 父主题: 导出ORC数据到MRS
基于GDS的跨集群互联互通 功能描述 在“基于Foreign Table的数据处理”的基础上,通过GDS进行数据中转,实现多个集群之间的数据同步。 使用场景 将数据从一个集群同步到另外一个集群,支持全量数据同步、过滤条件数据同步。 目前互联互通仅支持以下使用方式,除以下语句外,其他类型的语法均不支持。
插入或更新数据时报错,提示分布键不能被更新 问题现象 往数据库插入或更新数据时报错,提示分布键不能被更新,错误信息如下所示: 1 ERROR: Distributed key column can't be updated in current version 原因分析 GaussDB(DWS)分布键不允许被更新。
开启GaussDB(DWS)数据库用户三权分立 操作场景 默认情况下,创建GaussDB(DWS)集群时指定的管理员用户属于数据库的系统管理员,能够创建其他用户和查看数据库的审计日志,即权限不分立,三权分立模式为关闭。 为了保护集群数据的安全,GaussDB(DWS)支持对集群设
目前仅支持对接EXTERNAL SCHEMA对应的Hive端数据库的表进行SELECT、INSERT和INSERT OVERWRITE操作,其余操作均不支持。 MRS端两种数据源对应格式支持的操作参见表1。 表1 MRS端两种数据源支持的操作 数据源 表类型 操作 TEXT CSV PARQUET
创建和管理GaussDB(DWS)数据库对象 创建和管理GaussDB(DWS)数据库 创建和管理GaussDB(DWS) Schema 创建和管理GaussDB(DWS)表 选择GaussDB(DWS)表存储模型 创建和管理GaussDB(DWS)分区表 创建和管理GaussDB(DWS)索引