检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ANALYZE/PERFORMANCE命令查看执行过程的瓶颈算子,然后进行针对性优化。 如下面的执行过程信息中,Hashagg算子的执行时间占总时间的:(51016-13535)/ 56476 ≈66%,此处Hashagg算子就是这个查询的瓶颈算子,在进行性能优化时应当优先考虑此算子的优化。
容灾状态为“运行中”时可以执行灾备切换操作。 灾备切换需要一定时间,在此期间,原生产集群将可不用。 不同场景下进行灾备切换,RPO(Recovery Point Object,灾难发生后,系统和数据必须恢复到的时间点要求。)说明如下: 生产集群在“可用”的状态下,RPO=0。
集群配置的告警监控阈值不合理。 处理方法 可在GaussDB(DWS)管理控制台设置告警的触发条件,指定达到磁盘使用率、告警持续时间及告警频次。 集群磁盘使用率达到90%就会触发集群只读,需要预留时间来处理问题,避免使用率达到只读阈值。 登录GaussDB(DWS) 管理控制台。 在左侧导航栏,单击“告警管理”,切换至“告警”页签。
797ff7000001 (1 row) uuid_generate_v1函数根据时间信息、集群节点编号和生成该序列的线程号生成UUID,该UUID在单个集群内是全局唯一的,但在多个集群间的时间信息、集群节点编号、线程号和时钟序列仍然存在同时相等的可能性,因此多个集群间生成的UUID仍然存在极低概率的重复风险。
ANALYZE/PERFORMANCE命令查看执行过程的瓶颈算子,然后进行针对性优化。 如下面的执行过程信息中,Hashagg算子的执行时间占总时间的:(51016-13535)/ 56476 ≈66%,此处Hashagg算子就是这个查询的瓶颈算子,在进行性能优化时应当优先考虑此算子的优化。
需要进行临时调整及应急恢复。 为了保证您更好的使用DWS集群,获得较快的RTO(Recovery Time Objective,恢复时间目标)时间,需要您在搭建系统时遵守如表2所示的规则。 表1 DWS业务逻辑层 编号 业务逻辑层 描述 业务特点 1 业务层 业务侧的应用程序 业
FULL等,执行时会造成业务等锁阻塞。 高峰期执行持锁级别高的DDL操作,造成业务等锁阻塞。 长事务中执行持锁级别高的DDL操作,长时间持锁或等锁,均造成业务等锁阻塞。 方案建议: 根据业务周期,选择低峰期或运维时间窗执行DDL操作,明确DDL执行环境和耗时,避免锁阻塞。 规则3.2 DROP删除对象操作必须明确删除对象范围
797ff7000001 (1 row) uuid_generate_v1函数根据时间信息、集群节点编号和生成该序列的线程号生成UUID,该UUID在单个集群内是全局唯一的,但在多个集群间的时间信息、集群节点编号、线程号和时钟序列仍然存在同时相等的可能性,因此多个集群间生成的UUID仍然存在极低概率的重复风险。
热数据存储和冷数据存储最大的区别在于存储介质不同: 热数据存储是直接将频繁被查询或更新,对访问的响应时间要求很高的热数据存储在DN数据盘中。 冷数据存储将不更新,偶尔被查询,对访问的响应时间要求不高的冷数据存储在OBS中。 因为其存储介质的不同,决定了两者的成本、性能、以及适用场景,如表1所示:
FULL等,执行时会造成业务等锁阻塞。 高峰期执行持锁级别高的DDL操作,造成业务等锁阻塞。 长事务中执行持锁级别高的DDL操作,长时间持锁或等锁,均造成业务等锁阻塞。 方案建议: 根据业务周期,选择低峰期或运维时间窗执行DDL操作,明确DDL执行环境和耗时,避免锁阻塞。 规则3.2 DROP删除对象操作必须明确删除对象范围
容灾管理”。 在容灾列表中,在指定容灾所在行的“操作”列,单击“停止”按钮。 在弹出框单击“确定”。 此时容灾的“容灾状态”显示为“停止中”,停止需要时间请耐心等待。停止成功后“容灾状态”显示为“已停止” 容灾状态为“运行中”和“停止失败”时可以执行停止容灾操作。 停止后,将无法进行数据同步,请谨慎操作。
存在部分SQL语句使用内存资源过多,造成内存资源耗尽,其余语句执行作业时无法分配到内存就提示内存不足。 处理方法 调整业务执行时间窗,与高并发执行业务的时间错峰执行。 查询当前集群的内存使用情况,找到内存使用过高的语句并及时终止,释放资源之后集群内存就会恢复。具体的操作步骤如下: 8
案例:使排序下推 在做场景性能测试时,发现某场景大部分时间是CN端在做window agg,占到总执行时间95%以上,系统资源不能充分利用。研究发现该场景的特点是:将两列分别求sum作为一个子查询,外层对两列的和再求和后做trunc,然后排序。可以尝试将语句改写为子查询,使排序下推。
创建集群粒度的手动快照 前提条件 集群快照是GaussDB(DWS)集群在某一时间点的完整备份,记录了这一时刻指定集群的所有配置数据和业务数据。用户根据业务需要备份集群数据时,可以在“快照管理”页面创建集群的快照。 手动快照可以随时创建,在创建成功后会一直保存,直到在GaussD
blocktime 作业排队阻塞的最大时间,单位:秒。 取值范围:数值型,-1,1~INT64_MAX。 elapsedtime 作业执行的最大时间,单位:秒。 取值范围:数值型,-1,1~INT64_MAX。 allcputime 作业运行中使用的最大CPU时间,单位:秒。 取值范围:数值型,-1,1~INT64_MAX。
12xlarge ARM 48 384 100GB ~ 24000GB 1200 100 9600 4 有着极致的性能,适用于高吞吐数仓加工,高并发在线查询生产环境。 dwsx2.16xlarge.m7 X86 64 512 100GB ~ 32000GB 1600 100 12800 4
运维任务。智能运维会根据集群负载情况,选择合理时间窗、并发度完成用户指定的任务。在运维任务执行过程中,智能运维会时刻关注用户业务的变化,及时调整运维任务执行策略,以减轻对用户业务的影响。智能运维支持周期型和单次型任务的创建,执行时间窗可按照不同用户业务负载定制化。 智能运维具备一
案例:使排序下推 在做场景性能测试时,发现某场景大部分时间是CN端在做window agg,占到总执行时间95%以上,系统资源不能充分利用。研究发现该场景的特点是:将两列分别求sum作为一个子查询,外层对两列的和再求和后做trunc,然后排序。可以尝试将语句改写为子查询,使排序下推。
最后一次手动vacuum时间(不计算VACUUM FULL)。 last_autovacuum timestamp with time zone 最后一次autovacuum时间。 last_analyze timestamp with time zone 最后一次analyze时间。 last_autoanalyze
导入数据最佳实践 从OBS并行导入数据 将导入数据拆分为多个文件 导入大数据量的数据时,通常需要较长的时间及耗费较多的计算资源。 从OBS上导入数据时,如下方法可以提升导入性能:将数据文件存储到OBS前,尽可能均匀地将文件切分成多个,文件的数量为DN的整数倍更适合。 在导入前后验证数据文件