云架构中心-设计原则:过载控制

时间:2024-07-19 11:31:26

过载控制

在系统请求超过系统容量时,会由于资源饱和而导致系统请求失败,在云中,可以监控系统和工作负载的利用率,来自动添加或删除资源,以维持最佳级别来满足业务需求,而无需过度配置或配置不足。

控制业务流量一般通过动态资源管理来实现,不建议简单的使用静态门限来达到防过载的目的,有可能造成资源大量浪费,过载设计应该考虑以下方面:

  • 动态限流:根据系统资源消耗情况动态调整流控门限。
  • 弹性扩缩容:自动检测系统资源利用率,自动进行添加或删除资源。
  • 先负载均衡后流控:多个并行处理单元场景下,优先考虑负载均衡,避免单个处理单元资源受限导致业务受损;然后进行过载控制保护,使得整个系统的处理能力最大化。
  • 及早控制:系统过载时,应尽可能在业务流程处理前端或业务处理较早的处理模块或底层协议层次上控制业务接入,避免中间控制带来不必要的性能消耗。
  • 优先级保障:系统过载时保证高优先级的业务能够优先获得资源,优先得到处理,从而保证社会效益最大化。
support.huaweicloud.com/usermanual-architecture/architecture_02_0011.html