数据仓库服务 GAUSSDB(DWS)-使用集群前必读:性能管理要求:GaussDB(DWS)常见性能管理场景和建议

时间:2024-12-27 09:42:04

GaussDB (DWS)常见性能管理场景和建议

本节主要介绍常见的性能管理场景和建议手段,在业务上线和日常运维过程中,应当对性能容量进行充分评估,防止集群出现性能过载。

表2 常见性能管理场景

常见场景

性能风险

评估手段

建议措施

新集群上线

新集群在业务上线前的性能容量未知,有性能不达标风险。

需在业务上线前对集群进行充分压测,并双轨运行至少一个业务周期,关键业务/链路的qps、时延、最大并发量、最大响应时间等性能指标能够得到充分测试,从而确保新集群的性能容量能够得到充分评估。

参考GaussDB(DWS)资源负载管理配置动态资源管理并划分业务资源池,提前配置异常规则,配置熔断参数。

新业务上线

与集群现有业务出现资源争抢,新业务并发、资源消耗不合理时容易造成资源过载导致整体性能劣化。

新业务在测试环境得到充分测试,根据测试结果预估cpu消耗、执行时间、业务并发量等指标,分析新业务执行计划,确保执行计划最优。

当集群性能容量超过风险值时,应禁止新业务上线;当性能容量较为充裕时,新业务应通过资源池进行资源隔离,根据测试结果配置合理的熔断参数,并准备回退方案,确保出现问题后可快速回退。

灵活查询性能管理

灵活查询的SQL类型多样,执行效率和资源消耗差异很大,极端情况下可能会出现某一个“烂SQL”将整个集群性能拖垮的情况。

可根据topsql统计灵活查询的cpu消耗、内存消耗、执行时间、并发量等信息。

灵活查询用户应划分到独立于其他业务的资源池内,并进行CPU、内存等资源限制,并配置异常规则和熔断策略,及时拦截“烂SQL”,同时,建议遵循权限最小化原则,限制灵活查询用户的权限,禁止管理员用户作为灵活查询用户主账号。

存量业务增长

存量业务的数据量、并发量等持续增长,会造成集群资源使用率越来越高,不及时治理有过载风险。

定期统计存量业务的脏数据、倾斜率、analyze时间、分区个数、资源消耗情况等指标。

每周对集群进行定期巡检,定期对脏页率高的表进行脏数据清理,对统计信息不及时的表及时analyze。

support.huaweicloud.com/mgtg-dws/dws_01_00015.html