检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GaussDB(DWS)提供了部分免费存储空间,用于存放您的快照数据,免费空间内不计费。当快照数据存储空间超过免费空间大小时,超出部分按照对象存储服务(OBS)的计费规则进行计费,参见OBS价格详情。 免费空间大小是您的集群的总存储空间大小,即单节点存储空间大小 (副本)x 节点数。 数据仓库服务磁盘存储
户数据。 根据规划准备OBS存储位置和OBS桶的写权限 创建OBS桶,并在OBS桶中新建文件夹作为导出数据的存放目录。 登录OBS管理控制台。 单击“服务列表”,选择“对象存储服务”,打开OBS管理控制台页面。 创建桶。 如何创建OBS桶,具体请参见《对象存储服务控制台指南》中的创建桶章节。
大对象类型 概述 BLOB是一个二进制大对象,可以容纳可变数量的数据。这四个BLOB 类型是TINYBLOB,BLOB, MEDIUMBLOB和LONGBLOB。这些不同之处仅在于各自可以容纳的值的最大长度不同。DSC工具支持以下列出类型转换。 BLOB类型可以存储图片,列存储不支持BLOB。
ADB信息 单击“测试”,测试连通后,单击“保存”。 配置CDM的目标端连接。 参见同样方法,选择“作业管理 > 连接管理 > 新建连接”。 选择“数据仓库服务(DWS)”,单击“下一步”。 同理,填写DWS的数据库信息。 图8 DWS信息 单击“测试”,测试连通后,单击“保存”。
SCHEMA对象设计规范 建议2.7 不在其他USER的私有SCHEMA下创建对象 私有SCHEMA是指创建USER时自带的同名SCHEMA,该SCHEMA为该USER私有。 违反规则的影响: 在其他用户私有SCHEMA下创建对象,对象权限不受创建者控制,OWNER也非创建者。 方案建议:
TABLESPACE对象设计规范 规则2.8 禁止自定义TABLESPACE表空间 违反规则的影响: 分布式场景建表使用自定义表空间,导致表数据无法按照各DN分布式存储,出现存储倾斜。 方案建议: 创建表对象使用内置默认表空间。 父主题: GaussDB(DWS)对象设计规范
VIEW对象设计规范 建议2.16 视图的嵌套需避免超过三层 违反规范的影响: 视图嵌套过深导致执行计划不稳定、耗时不稳定。 视图依赖的对象重建风险高,锁冲突发生概率增大。 方案建议: 创建视图直接基于物理表查询,不建议嵌套视图。 父主题: GaussDB(DWS)对象设计规范
从密钥中选择 方式二:输入密钥ID。输入在KMS侧给当前租户进行授权的KMS密钥ID,详情请参见查看密钥。 当跳转至KMS侧创建授权时被授权对象必须是账号,不能是用户。并且授权操作必须至少包含“查询密钥信息”、“加密数据”、“解密数据”3项权限。 图2 输入密钥 表1 参数说明 参数
存在关联计算的对象创建在同一个DATABASE中 违反规则的影响: 跨库访问无论使用哪种方案,性能均劣于同一DATABASE内的关联操作。 方案建议: 创建多个DATABASE的场景,将需要执行关联计算的对象,创建在同一DATABASE中。 父主题: GaussDB(DWS)对象设计规范
fka连接配置”参数)。 填写作业名称,选择“Kafka连接配置”、“DWS集群连接配置”及“自定义表/字段映射”,然后单击“连接测试”。 连接测试成功单击“下一步”进入参数配置页面。 参数配置完成后单击“下一步”进入确认页面。 确认无误后,单击“确定”创建作业。 返回作业列表中
数据如何存储到GaussDB(DWS)? GaussDB(DWS)支持多数据源高效入库,典型的入库方式如下所示。详细指导请参见导入数据。 从OBS导入数据。 数据上传到OBS对象存储服务中,再从OBS中导入,支持CSV,TEXT格式数据。 通过INSERT语句直接插入数据。 用户可以通过GaussDB(DWS
USER对象设计规范 规则2.5 禁止使用特殊权限用户运行业务,需遵循权限最小分配原则 违反规则的影响: 特殊权限用户如管理员用户,均具有特殊用途,使用此类用户运行业务有安全和管控风险。 方案建议: 使用普通用户运行业务,特殊权限类用户仅用于管理类操作。 规则2.6 禁止使用一个数据库用户运行所有业务
存在关联计算的对象创建在同一个DATABASE中 违反规则的影响: 跨库访问无论使用哪种方案,性能均劣于同一DATABASE内的关联操作。 方案建议: 创建多个DATABASE的场景,将需要执行关联计算的对象,创建在同一DATABASE中。 父主题: GaussDB(DWS)对象设计规范
TABLESPACE对象设计规范 规则2.8 禁止自定义TABLESPACE表空间 违反规则的影响: 分布式场景建表使用自定义表空间,导致表数据无法按照各DN分布式存储,出现存储倾斜。 方案建议: 创建表对象使用内置默认表空间。 父主题: GaussDB(DWS)对象设计规范
集群操作列的“作业管理”,选择“连接管理 > 新建连接”。 连接器类型选择“Oracle”,单击“下一步”。 配置Oracle连接,单击“测试”通过后,单击“保存”。 表1 Oracle连接信息 参数项 取值 名称 oracle 数据库服务器 192.168.1.100(示例,请填写Oracle实际的公网IP)
TABLE对象设计规范(重点) 规则2.9 创建表时必须选择正确的分布方式和分布列 违反规范的影响: 分布式和分布列选择错误,导致表数据存储倾斜,访问性能下降,严重情况会触发存储和计算资源过载。 方案建议: 创建表时通过DISTRIBUTE BY显式指定分布方式和分布列,分布列选择原则如下表所示。
INDEX对象设计规范(重点) 规则2.14 只创建必要的索引,创建索引必须选择合适的列和顺序 违反规范的影响: 冗余索引浪费空间,索引多影响入库效率。 组合索引中列顺序错误,影响查询效率。 最佳实践: 索引的使用需兼顾以下条件: 索引列必须是常用于过滤条件或JOIN关联条件的列。
USER对象设计规范 规则2.5 禁止使用特殊权限用户运行业务,需遵循权限最小分配原则 违反规则的影响: 特殊权限用户如管理员用户,均具有特殊用途,使用此类用户运行业务有安全和管控风险。 方案建议: 使用普通用户运行业务,特殊权限类用户仅用于管理类操作。 规则2.6 禁止使用一个数据库用户运行所有业务
开发指南>GUC参数>GTM相关参数 DWS导出空表到xsky S3,支持生成空文件 新增参数obs_null_file,用于dws和obs之间空文件导入导出的处理。 SQL语法>DDL>CREATE FOREIGN TABLE (OBS导入导出) autovacuum易用性提升 新增GUC参enable
SCHEMA对象设计规范 建议2.7 不在其他USER的私有SCHEMA下创建对象 私有SCHEMA是指创建USER时自带的同名SCHEMA,该SCHEMA为该USER私有。 违反规则的影响: 在其他用户私有SCHEMA下创建对象,对象权限不受创建者控制,OWNER也非创建者。 方案建议: