检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
1 SELECT * FROM t1, t2 WHERE t1.a = t2.b; 则执行计划存在“Streaming(type: REDISTRIBUTE)”,即DN根据选定的列把数据重分布到所有的DN,这将导致DN之间存在较大通信数据量,如图1所示。 图1 选择合适的分布列案例(一)
配置JDBC连接(使用负载均衡方式) 背景信息 很多用户在使用JDBC连接集群时只连接集群的一个CN,这就导致单个CN压力较大并且别的CN资源浪费,并且这种方式还有单点故障导致连接不可用的风险。 用户可使用JDBC连接多个CN避免以上问题。主要有以下三种方式: 使用ELB连接集群:弹
ping=on 控制查询优化器是否使用分布式框架,执行快速执行计划。设置为“on”,表示执行计划在CN和DN上各自生成;设置为“off”,表示使用分布式框架,即执行计划在CN上生成,然后发送到DN中执行。 说明: 如果只需要在当前数据库连接(即当前Session)中临时更改该参数
1 SELECT * FROM t1, t2 WHERE t1.a = t2.b; 则执行计划存在“Streaming(type: REDISTRIBUTE)”,即DN根据选定的列把数据重分布到所有的DN,这将导致DN之间存在较大通信数据量,如图1所示。 图1 选择合适的分布列案例(一)
查询外部表。 CteScan CTE表扫描 扫描SELECT查询中用WITH子句定义的子查询。 连接算子 连接算子对应了关系代数中的连接操作,以表 t1 join t2 为例,主要的集中连接类型如下:inner join、left join、right join、full join、semi
查询外部表。 CteScan CTE表扫描 扫描SELECT查询中用WITH子句定义的子查询。 连接算子 连接算子对应了关系代数中的连接操作,以表 t1 join t2 为例,主要的集中连接类型如下:inner join、left join、right join、full join、semi
“数据库名称”:输入所要连接的数据库名称。首次使用客户端连接集群时,请指定为集群的默认数据库“gaussdb”。 “集群地址”:请参见获取集群连接地址进行获取。如果通过公网地址连接,请指定为集群“公网访问域名”,如果通过内网地址连接,请指定为集群“内网访问域名”。如果通过弹性负载均衡连接,请指定为“弹性负载均衡地址”。
删除告警订阅 删除订阅的告警。 可用区 查询可用区列表 查询租户创建集群时可使用的可用区列表。 连接管理 申请域名 为指定集群申请域名 修改集群域名 为指定集群修改域名。 删除集群域名 删除指定集群域名。 获取集群可绑定的ELB列表 查询集群可以关联的ELB列表。 集群绑定ELB 集群绑定ELB。
空。 JDBC支持数据库连接重连。 新增参数autoReconnect,是否开启数据库连接自动重连,默认为false。 新增参数reConnectCount,自动重连次数,默认为10。当“autoReconnect=true”时,该参数生效,超过配置的连接次数,重连失败。 版本 8
co_node_name cstring) 描述:清理CN上无效的后台线程(这些后台线程持有无效的pooler连接,这里无效的pooler连接指的是连接到当前DN备实例的连接)。 返回值类型:record pg_nodes_memory() 描述:查看所有节点的内存占用。 返回值类型:record
DELETING_NODE:删除节点 DELETE_NODE_FAILED:删除节点失败 REDISTRIBUTING:重分布中 REDISTRIBUTE_FAILURE:重分布失败 WAITING_REDISTRIBUTION:待重分布 REDISTRIBUTION_PAUSED:重分布暂停 ELB_BINDING:弹性负载均衡绑定中
DELETING_NODE:删除节点 DELETE_NODE_FAILED:删除节点失败 REDISTRIBUTING:重分布中 REDISTRIBUTE_FAILURE:重分布失败 WAITING_REDISTRIBUTION:待重分布 REDISTRIBUTION_PAUSED:重分布暂停 ELB_BINDING:弹性负载均衡绑定中
步骤四:创建Kafka和DWS的增强型跨源连接 放通Kafka的安全组,允许DLI队列所在的网段可以访问Kafka。 回到Kafka控制台,单击Kafka实例名称进入基本信息。查看“连接信息”的“内网连接地址”,并记录下此地址,以备后续步骤使用。 图3 kafka内网连接地址 单击网络的安全组名称。
RedisConf object 重分布配置。 redis_progress RedisProgress object 重分布进度信息。 redis_table_detail RedisTableDetail object 重分布表信息。 表5 RedisConf 参数 参数类型
设置是否和服务器进行SSL连接协商,以及指定SSL连接的优先级。 取值及含义: disable:只尝试非SSL连接。 allow:首先尝试非SSL连接,如果连接失败,再尝试SSL连接。 prefer:首先尝试SSL连接,如果连接失败,将尝试非SSL连接。 require:只尝试SSL连接。如果存在
ler中的缓存连接状态。该视图只能在CN上执行查询,显示本地CN的pooler模块的连接缓存信息。 表1 PG_POOLER_STATUS字段 名称 类型 描述 database text 数据库名称。 user_name text 用户名。 tid bigint 连接CN的线程ID。
ler中的缓存连接状态。该视图只能在CN上执行查询,显示本地CN的pooler模块的连接缓存信息。 表1 PG_POOLER_STATUS字段 名称 类型 描述 database text 数据库名称。 user_name text 用户名。 tid bigint 连接CN的线程ID。
存储层数据倾斜 GaussDB(DWS)数据库中,数据分布存储在各个DN上,通过分布式执行提高查询的效率。但是,如果数据分布存在倾斜,则会导致分布式执行某些DN成为瓶颈,影响查询性能。这种情况通常是由于分布列选择不合理,可以通过调整分布列的方式解决。 例如下例: 1 2 3 4 5
可以选择目录,支持CSV和TEXT文件类型。填写OBS桶导入需要创建外表的一些参数,通过OBS外表将OBS桶文件写入到选择的普通表中。 存算一体(单机部署)8.2.0.100及以上集群版本支持通过OBS文件导入功能。 表3 obs导入参数 参数 描述 样例值 存储位置 从OBS桶文件中选择文件。
对于这种场景,Stream执行框架分为如下三种计划形态: hashagg+gather(redistribute)+hashagg redistribute+hashagg(+gather) hashagg+redistribute+hashagg(+gather) GaussDB(DWS)提