检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
审视和修改表定义 审视和修改表定义概述 选择存储模型 选择分布方式 选择分布列 使用分区表 选择数据类型 父主题: SQL调优指南
审视和修改表定义 审视和修改表定义概述 选择存储模型 使用分区表 选择数据类型 父主题: SQL调优指南
灵活地进行数据管理,但对用户本身的数据抽象能力有一定的要求。如表1所示。 表1 策略及适用场景 策略 描述 适用场景 Hash 表数据通过hash方式散列到集群中的所有DN实例上。 数据量较大的事实表。 Replication 集群中每一个DN实例上都有一份全量表数据。 小表、维度表。
单击管理控制台左上角的,选择区域和项目。 在页面左上角单击,选择“数据库 > 云数据库 GaussDB”,进入云数据库 GaussDB信息页面。 在“实例管理”页面,选择指定的实例,单击实例名称。 在左侧导航栏,选择“参数管理”。 在搜索框中搜索参数max_wal_senders。 修改为目标参数值,建议取值范围8 ~
活地进行数据管理,但对用户本身的数据抽象能力有一定的要求。 策略 描述 适用场景 Hash 表数据通过hash方式散列到集群中的所有DN实例上。 数据量较大的事实表。 Replication 集群中每一个DN实例上都有一份全量表数据。 小表、维度表。 Range 表数据对指定列按照范围进行映射,分布到对应DN。
在页面左上角单击,选择“数据库 > 云数据库 GaussDB”,进入云数据库 GaussDB信息页面。 在“实例管理”页面,选择指定的实例,单击实例名称。 在左侧导航栏,选择“参数管理”。 在搜索框中搜索参数password_lock_time。 修改为目标参数值,取值范围为0~365,单击“保存”。
少DN之间的通信数据量。 对于Hash分表策略,如果分布列选择不当,可能导致数据倾斜,查询时出现部分DN的I/O短板,从而影响整体查询性能。因此在采用Hash分表策略之后需对表的数据进行数据倾斜性检查,以确保数据在各个DN上是均匀分布的。可以使用以下SQL检查数据倾斜性: 1 2
范围分区表:将数据基于范围映射到每一个分区。这个范围是由创建分区表时指定的分区键决定的。分区键经常采用日期,例如将销售数据按照月份进行分区。 列表分区表:将数据中包含的键值分别存储在不同的分区中,依次将数据映射到每一个分区,分区中包含的键值由创建分区表时指定。 哈希分区表:将数据根据内部
不存储数据,数据实际是存储在分区上的。分区表和普通表相比具有以下优点: 改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索效率。 增强可用性:如果分区表的某个分区出现故障,表在其他分区的数据仍然可用。 方便维护:如果分区表的某个分区出现故障,需要修复数据,只修复该分区即可。
范围分区表:将数据基于范围映射到每一个分区。这个范围是由创建分区表时指定的分区键决定的。分区键经常采用日期,例如将销售数据按照月份进行分区。 列表分区表:将数据中包含的键值分别存储在不同的分区中,依次将数据映射到每一个分区,分区中包含的键值由创建分区表时指定。 哈希分区表:将数据根据内部
不存储数据,数据实际是存储在分区上的。分区表和普通表相比具有以下优点: 改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索效率。 增强可用性:如果分区表的某个分区出现故障,表在其他分区的数据仍然可用。 方便维护:如果分区表的某个分区出现故障,需要修复数据,只修复该分区即可。
GaussDB如何设置显示和解释时间类型数值时使用的时区 云数据库GaussDB可以通过控制台设置显示和解释时间类型数值时使用的时区。详见如下操作。 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 在页面左上角单击,选择“数据库 > 云数据库 GaussDB”,进入云数据库 GaussDB信息页面。
参数化路径的Hint 功能描述 指明参数化路径,条件谓词下推方式。 语法格式 1 2 predpush( [@queryblock] src1 src2) predpush( [@queryblock] src, dest) 参数说明 @queryblock请参见指定Hint所
cm_agent参数 log_dir 参数说明:log_dir决定存放cm_agent日志文件的目录。可以是绝对路径,或者是相对路径(相对于cm_agent数据目录的路径)。 参数类型:字符串 参数单位:无 取值范围:合法目录路径。 默认值:“$GAUSSLOG/cm/cm_agent”
cm_agent参数 log_dir 参数说明:log_dir决定存放cm_agent日志文件的目录。可以是绝对路径,或者是相对路径(相对于cm_agent数据目录的路径)。 参数类型:字符串 参数单位:无 取值范围:合法目录路径。 默认值:“$GAUSSLOG/cm/cm_agent”
少DN之间的通信数据量。 对于Hash分表策略,如果分布列选择不当,可能导致数据倾斜,查询时出现部分DN的I/O短板,从而影响整体查询性能。因此在采用Hash分表策略之后需对表的数据进行数据倾斜性检查,以确保数据在各个DN上是均匀分布的。可以使用以下SQL检查数据倾斜性 1 2 3
cm_server参数 log_dir 参数说明:log_dir决定存放cm_server日志文件的目录。可以是绝对路径,或者是相对路径(相对于cm_server数据目录的路径)。 参数类型:字符串 参数单位:无 取值范围:合法目录路径。 默认值:“$GAUSSLOG/cm/cm_serve
cm_server参数 log_dir 参数说明:log_dir决定存放cm_server日志文件的目录。可以是绝对路径,或者是相对路径(相对于cm_server数据目录的路径)。 参数类型:字符串 参数单位:无 取值范围:合法目录路径。 默认值:“$GAUSSLOG/cm/cm_serve
活地进行数据管理,但对用户本身的数据抽象能力有一定的要求。 策略 描述 适用场景 Hash 表数据通过hash方式散列到集群中的所有DN实例上。 数据量较大的事实表。 Replication 集群中每一个DN实例上都有一份全量表数据。 小表、维度表。 Range 表数据对指定列按照范围进行映射,分布到对应DN。
选择存储模型 进行数据库设计时,表设计上的一些关键项将严重影响后续整库的查询性能。表设计对数据存储也有影响:好的表设计能够减少I/O操作及最小化内存使用,进而提升查询性能。 表的存储模型选择是表定义的第一步。客户业务属性是表的存储模型的决定性因素,依据下面表格选择适合当前业务的存储模型。