检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GaussDB(DWS) SSD云盘和SSD本地盘的区别? SSD云盘支持后期进行扩容,推荐您使用SSD云盘。两者的区别如下: SSD云盘: 使用SSD类型的EVS作为数据存储介质,存储容量更加灵活,且可以随着数据的增长,进行磁盘扩容操作。 由于SSD云盘不和ECS规格进行强绑定,因此可以根据实际需求进行规格调整。
分布式执行框架 GS_235100005 错误码: Stream plan check failed. Execution datanodes list of stream node[%d] mismatch in parent node[%d]. 解决方案:请使用INTERNAL
GaussDB(DWS)热数据存储和冷数据存储的区别? 热数据存储和冷数据存储最大的区别在于存储介质不同: 热数据存储是直接将频繁被查询或更新,对访问的响应时间要求很高的热数据存储在DN数据盘中。 冷数据存储将不更新,偶尔被查询,对访问的响应时间要求不高的冷数据存储在OBS中。 因为其存储介质的不同,决定
在数据仓库类型的数据库中,大表的分布列选择对于数据库和语句查询性能都有至关重要的影响。 如果表的分布列选择不当,在数据导入后有可能出现数据分布倾斜,进而导致某些磁盘的使用明显高于其他磁盘,极端情况下会导致集群只读。对于Hash分表策略,存在数据倾斜情况下,查询时出现部分DN的I/O短板
级配置。 重分布队列的排序依据表的relpage大小进行,为确保relpage大小正确,建议在重分布之前对需要重分布的表执行analyze操作。 离线重分布 注意事项 离线重分布模式下数据库不支持DDL和DCL操作,正在重分布的表只支持简单的DQL操作。 表重分布期间会对表加共享
来调整存储能力和计算能力,也可以通过横向扩展和收缩分布式节点来调整存储和计算能力,还可以通过集群Resize同时做横向扩展、纵向扩展,并且同时调整集群的拓扑结构。 集群拓扑详解 要想充分理解DWS的弹性伸缩能力,首先需要了解DWS的集群拓扑结构。如下是DWS的简单的ECS+EVS部署结构:
String 专属分布式存储池的状态。 available:专属分布式存储池处于可用状态。 deploying:专属分布式存储池处于正在部署的过程中,不可使用。 extending:专属分布式存储池处于正在扩容的过程中,可使用。 created_at String 专属分布式存储池的创建时间。
目前,GaussDB(DWS)优化器在分布式框架下制定语句的执行策略时,有三种执行计划方式:生成下推语句计划、生成分布式执行计划、生成发送语句的分布式执行计划。 下推语句计划:指直接将查询语句从CN发送到DN进行执行,然后将执行结果返回给CN。 分布式执行计划:指CN对查询语句进行编译和优化,生成计划树
DML查询:统计分析类查询 (group,join的数据量大的场景) DML增删改:UPDATE/DELETE多的场景、INSERT小批量插入的场景。 DML查询:高并发的点查询。 规则2.11 创建表时必须选择正确的分区策略 违反规范的影响: 分区的优点如下,如不做分区,其查询性能和数据治理效率会下降,数据量越大这种劣化越大。
确保VPC、ECS、OBS、Kafka、DLI和DWS服务在同一个区域内,例如华北-北京四。 确保Kafka、DLI、DWS网络互通。本实践将Kafka和DWS创建在同一个区域和虚拟私有云下,同时在Kafka和DWS的安全组中放通了DLI的队列所在网段,确保网络互通。 为确保DLI到DWS的连接链路稳定,请创建完DWS集群后为集群绑定ELB服务。
text 被锁定对象的类型。 nodename name 被锁定对象的节点名称。 dbname name 被锁定对象的数据库名称。如果被锁定对象是事务,则为NULL。 nspname name 被锁定对象的命名空间名称。 relname name 被锁定对象对应的关系名称。如果被锁
规则3.7 禁止执行不下推的SQL GaussDB(DWS)为分布式架构,SQL语句必须下推才能分利用分布式的计算资源,达到性能最优。 违反规范的影响: 不下推的SQL执行性能差,严重情况会导致CN资源瓶颈,影响整体业务。 方案建议: 不使用不下推的语法和不下推的函数,具体参考语句下推调优。
transaction>, hold lockmode (null). 这是由于分布式锁导致的,两个DN节点都锁住了自己的数据块,然后又在等待对方的数据块,所以导致锁超时。 这种行为是两阶段锁的特性,分布式情况下都会面临这样的问题。 处理方法 建议对单表执行MERGE,将并发操作改为串行。 父主题:
DML查询:统计分析类查询 (group,join的数据量大的场景) DML增删改:UPDATE/DELETE多的场景、INSERT小批量插入的场景。 DML查询:高并发的点查询。 规则2.11 创建表时必须选择正确的分区策略 违反规范的影响: 分区的优点如下,如不做分区,其查询性能和数据治理效率会下降,数据量越大这种劣化越大。
目前,GaussDB(DWS)优化器在分布式框架下制定语句的执行策略时,有三种执行计划方式:生成下推语句计划、生成分布式执行计划、生成发送语句的分布式执行计划。 下推语句计划:指直接将查询语句从CN发送到DN进行执行,然后将执行结果返回给CN。 分布式执行计划:指CN对查询语句进行编译和优化,生成计划树
TABLESPACE对象设计规范 规则2.8 禁止自定义TABLESPACE表空间 违反规则的影响: 分布式场景建表使用自定义表空间,导致表数据无法按照各DN分布式存储,出现存储倾斜。 方案建议: 创建表对象使用内置默认表空间。 父主题: GaussDB(DWS)对象设计规范
规则3.7 禁止执行不下推的SQL GaussDB(DWS)为分布式架构,SQL语句必须下推才能分利用分布式的计算资源,达到性能最优。 违反规范的影响: 不下推的SQL执行性能差,严重情况会导致CN资源瓶颈,影响整体业务。 方案建议: 不使用不下推的语法和不下推的函数,具体参考语句下推调优。
TABLESPACE对象设计规范 规则2.8 禁止自定义TABLESPACE表空间 违反规则的影响: 分布式场景建表使用自定义表空间,导致表数据无法按照各DN分布式存储,出现存储倾斜。 方案建议: 创建表对象使用内置默认表空间。 父主题: GaussDB(DWS)对象设计规范
function 'PGXC_POOL_CONNECTION_STATUS' in distributed query. 解决方案:请使用不与分布式表连接的简单查询。 level: ERROR 父主题: 通信
time zone 等待锁的事务的开始时间。 waitqueryid bigint 等待锁的线程的最新查询ID。 waitquery text 等待锁的线程的最新查询语句。 waitpid bigint 等待锁的线程ID。 waitmode text 等待的锁的级别。 holdusername