检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
手动快照 创建集群粒度的手动快照 创建schema粒度的手动快照 删除手动快照 父主题: 备份与恢复GaussDB(DWS)集群
自动快照 自动快照概述 设置自动快照策略 复制自动快照 删除自动快照 父主题: 备份与恢复GaussDB(DWS)集群
对于Hash分布策略,如果分布列选择不当,可能导致数据倾斜。因此在采用Hash分布策略之后会对用户表的数据进行数据倾斜性检查,以确保数据在各个DN上是均匀分布的。一般情况下分布列都是选择键值重复度小,数据分布比较均匀的列。 操作步骤 分析数据源特征,选择若干个键值重复度小,数据分布比较均匀的备选分布列。
数据仓库服务与华为云平台其他一系列服务已无缝集成,以便用户能够快速部署端到端的数据分析和解决方案。 端到端数据分析流程如下图所示,该流程展示了每个过程可以使用的云服务。 图2 端到端数据分析流程
缓存个数以及数据缓存区大小。 如果导入表存在索引,在数据导入过程中,将增量更新索引信息,影响数据导入性能。建议在执行数据导入前,先删除相关表的索引。在数据导入完成后,再重新创建索引。 操作步骤 在GaussDB(DWS)数据库中,创建目标表,用于存储从OBS导入的数据。 目标表的
如何选择GaussDB(DWS)区域和可用分区 什么是区域、可用分区? 区域和可用分区用来描述数据中心的位置,您可以在特定的区域、可用分区创建资源。 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、
DWS元数据不一致-分区索引异常 问题现象 某局点查看表定义报错:“The local index xxx on the partition xxx not exist.”。 原因分析 该问题主表索引无损坏,报错原因是由于单个分区索引记录在系统表pg_partition中与其他系统表不一致,未找到对应分区索引信息。
数据仓库错误码 SQL标准错误码说明 第三方库错误码说明 GAUSS-00001 -- GAUSS-00100 GAUSS-00101 -- GAUSS-00200 GAUSS-00201 -- GAUSS-00300 GAUSS-00301 -- GAUSS-00400 GAUSS-00401
通过OBS外表并行导入数据 导入流程图 图2 并行导入流程 表1 流程说明 流程 说明 子任务 上传数据至OBS 在OBS服务器上规划存储路径,并上传数据文件。 详细请参见上传数据到OBS。 - 创建OBS外表 创建外表用于识别OBS服务器上的数据源文件。在OBS外表中保存了数据源在OBS服务器上的
连接的数据库。当数据源为OBS时为必选字段。 响应参数 表3 响应Body参数 参数 参数类型 描述 id String 数据源配置ID。 job_id String 创建数据源的任务ID。 请求示例 创建名为test154的OBS数据源,用户名为“DWSAccessOBS”,连接gaussdb数据库:
一个用户最多可创建100个桶,但每个桶中存放的总数据容量和对象/文件数量没有限制。 对象:是存储在OBS中的基本数据单位。用户上传的数据以对象的形式存储在OBS的桶中。对象的属性包括名称Key,Metadata,Data。 通常,将对象等同于文件来进行管理,但是由于OBS是一种对象存储服务,并没有文件系统
创建OBS外表 操作步骤 根据上传数据到OBS中规划的路径,由此确定创建外表时使用的参数loaction的值。 用户获取OBS访问协议对应的AK值和SK值。获取访问密钥,请登录管理控制台,单击右上角的用户名并选择菜单“我的凭证”,然后在左侧导航树单击“访问密钥”。在访问密钥页面,
迁移业务数据至GaussDB(DWS)集群 使用GDS-Kafka工具迁移数据至GaussDB(DWS)集群 管理数据源
准备数据构建工具编译环境 远程连接ECS弹性云服务器。 执行以下命令, 安装git。 yum install git 执行以下命令,安装gcc。 yum install gcc 父主题: 构建TPC-H&TPC-DS使用数据
TPC-H测试数据 表1 TPC-H测试数据 序号 表名 行数 表大小 1 region 5 294KB 2 nation 25 298KB 3 supplier 10,000,000 1020MB 4 customer 150,000,000 8226MB 5 part 200
TPC-DS测试数据 表1 TPC-DS测试数据 序号 表名 行数 表大小 1 customer_address 6,000,000 126MB 2 customer_demographics 1,920,800 11MB 3 date_dim 73,049 11MB 4 warehouse
如何查看GaussDB(DWS)数据库用户的创建时间? 方式一: 在创建GaussDB(DWS)数据库用户时,如果指定了用户的生效时间(VALID BEGIN)与用户创建时间一致,且之后未修改过该用户生效时间的情况下,就可以使用视图PG_USER查看用户列表,并通过valbegi
GaussDB(DWS)敏感数据管理 GaussDB(DWS)行级访问控制 GaussDB(DWS)数据脱敏 GaussDB(DWS)字符串加解密 父主题: GaussDB(DWS)数据库安全管理
GaussDB(DWS)敏感数据管理 GaussDB(DWS)行级访问控制 GaussDB(DWS)数据脱敏 GaussDB(DWS)字符串加解密 使用pgcrypto加密GaussDB(DWS)数据 父主题: GaussDB(DWS)数据库安全管理
支持的数据类型 目前大数据领域,主流文件格式为ORC。GaussDB(DWS)主要支持ORC文件格式。用户利用HIVE将数据导出存储为ORC文件格式,使用GaussDB(DWS)通过只读外表对ORC文件内的数据进行查询分析,因此,需要在ORC文件格式支持的数据类型与GaussDB