检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通常优化器会根据统计信息选择一组不倾斜的分布键进行数据重分布。当默认选择的分布键有倾斜时,可以手动指定重分布的列,避免数据倾斜。 在选择分布键的时候,通常要根据数据分布特征选取一组distinct值比较高的列作为分布列,这样可以保证重分布后,数据均匀的分布到各个DN。 在编写好hint后,可以通过explain
postgresql”替换为“com.huawei.gauss200.jdbc”),数据库连接的URL前缀为“jdbc:gaussdb”,其余与gsjdbc4.jar相同。 驱动类 在创建数据库连接之前,需要加载数据库驱动类“org.postgresql.Driver”(对应包gsjdbc4
赋予用户schema的all权限后建表仍然报错ERROR: current user does not have privilege to role tom 问题现象 有两个用户tom和jerry,jerry需要在tom的同名schema下创建表,于是tom把该schema的al
案例:调整GUC参数best_agg_plan 现象描述 t1的表定义为: 1 create table t1(a int, b int, c int) distribute by hash(a); 假设agg下层算子所输出结果集的分布列为setA,agg操作的group by
PGXC_STAT_REPLICATION PGXC_STAT_REPLICATION视图显示集群中各节点上日志同步的状态信息,除新增node_name(节点名称)字段外,其余字段内容和PG_STAT_REPLICATION视图相同。需要有系统管理员权限才可以访问此视图。 表1
GS_RESPOOL_RESOURCE_INFO GS_RESPOOL_RESOURCE_INFO视图显示CN上所有资源池作业运行信息以及当前实例(CN/DN)所有资源池资源使用信息。 DN上仅显示当前DN所属逻辑集群的资源池监控信息。 表1 GS_RESPOOL_RESOURCE_INFO字段
CN:显示所有DN上对应用户正在使用的内存累加和。 total_memory integer 可以使用的内存大小,单位MB。值为0表示未限制最大可用内存,其限制取决于数据库最大可用内存。 DN:显示当前DN上对应用户可以使用的内存大小。 CN:显示所有DN上对应用户可以使用的内存大小之和。 used_cpu
PGXC_NODE_STAT_RESET_TIME PGXC_NODE_STAT_RESET_TIME视图显示集群中各节点的统计信息重置时间,除新增node_name(节点名称)字段外,其余字段内容和GS_NODE_STAT_RESET_TIME视图相同。需要有系统管理员权限才可以访问此视图。
GS_RESPOOL_RESOURCE_HISTORY GS_RESPOOL_RESOURCE_HISTORY表记录资源池监控历史信息,CN和DN上均进行记录。 表1 GS_RESPOOL_RESOURCE_HISTORY字段 名称 类型 描述 timestamp timestamp
PG_GLOBAL_TEMP_ATTACHED_PIDS 查看全局临时表在当前节点占有资源的会话信息。该视图仅8.2.1.220及以上集群版本支持。 表1 PG_GLOBAL_TEMP_ATTACHED_PIDS字段 名称 类型 描述 schemaname name 模式名。 tablename
PGXC_NODE_STAT_RESET_TIME PGXC_NODE_STAT_RESET_TIME视图显示集群中各节点的统计信息重置时间,除新增node_name(节点名称)字段外,其余字段内容和GS_NODE_STAT_RESET_TIME视图相同。需要有系统管理员权限才可以访问此视图。
GS_CLUSTER_RESOURCE_INFO GS_CLUSTER_RESOURCE_INFO视图显示的是所有DN资源的汇总信息。 表1 GS_CLUSTER_RESOURCE_INFO字段 名称 类型 描述 min_mem_util integer DN最小内存使用率。 max_mem_util
PG_STAT_GET_MEM_MBYTES_RESERVED PG_STAT_GET_MEM_MBYTES_RESERVED视图显示线程在内存中保存的当前活动信息。该函数在调用时需要指定线程ID,线程ID的选取请参考PG_STAT_ACTIVITY中的pid,线程ID为0时表示选取当前线程ID,例如:
PGXC_RESPOOL_RESOURCE_HISTORY PGXC_RESPOOL_RESOURCE_HISTORY用于查询所有实例上资源池监控历史信息。 表1 PGXC_RESPOOL_RESOURCE_HISTORY字段 名称 类型 描述 nodename name 实例名称,包含CN和DN。
PGXC_GLOBAL_TEMP_ATTACHED_PIDS 查看全局临时表在CN上占有资源的会话信息。该视图仅8.2.1.220及以上集群版本支持。 表1 PG_GLOBAL_TEMP_ATTACHED_PIDS字段 名称 类型 描述 nodename name 节点名。 schemaname
PGXC_OBS_IO_SCHEDULER_STATS PGXC_OBS_IO_SCHEDULER_STATS视图显示OBS IO Scheduler读/写请求相关的近期实时统计信息。该系统视图仅9.1.0及以上版本支持。 表1 PGXC_OBS_IO_SCHEDULER_STATS字段
中第9层redistribute并没有数据倾斜,hashjoin慢的原因是由于第18层redistribute后数据倾斜导致。 经过实际数据查证,customer_address的两个join列的不同值数目较少,使用其进行join容易出现数据倾斜,故把customer_addre
案例:设置cost_param对查询性能优化 cost_param参数用于控制在特定的客户场景中,使用不同的估算方法使得估算值与真实值更接近。此参数可以同时控制多种方法,与某一方法对应的位做与操作,不为0表示该方法被选择。 场景一:优化前 cost_param的bit0(set
group by a; 从计划可以看出,对Hash Agg进行倾斜优化后,采用了双层agg实现,大幅度过滤了进行重分布时的数据量,减少了重分布时间。 此外,需要说明的是,对于子查询,支持使用查询内部的列进行hint,如: 1 2 3 4 5 explain select
Join顺序的Hint 功能描述 指明join的顺序,包括内外表顺序。 语法格式 仅指定join顺序,不指定内外表顺序。 1 leading(join_table_list) 同时指定join顺序和内外表顺序,内外表顺序仅在最外层生效。 1 leading((join_table_list))