搜索_华为云

RES12-04 出现问题后尽快恢复业务 - 云架构中心

习等方式，预测系统的风险情况，提前进行预防和处理。在进行应急恢复处理时，通常需要尽快缓解或恢复业务，快速结束业务中断对客户的影响，然后再启动问题定位和修复处理流程，以减少业务中断时间。组织协调：故障发生后，应急恢复主席需要迅速组织相关人员快速恢复业务。应急恢复处理：系统发生

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

点。云数据库 TaurusDB服务还支持异构容灾实例(MySQL节点)，支持在极端场景，如社区未知bug、用户误操作、AZ级故障导致服务无法正常提供服务等场景，可以快速将服务切换到异构容灾实例继续提供服务。数据备份和恢复云数据库 TaurusDB实例支持自动备份和手动备份，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
COST05-03 定期回顾和审核 - 云架构中心

每次回顾和审核时，持续改进流程，例如，通过降低测试和变更的成本从而提升整体的优化频率。最后，在云厂商新的服务、资源类型和配置推出后，也可以启动流程，对它们进行评估，以优化您的工作负载成本。父主题： COST05 优化指定策略和目标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
跨云双活方案 - 云架构中心
跨云双活方案 - 云架构中心

题时自动回滚。应急恢复处理制定应急处理机制，指定应急恢复人员，以便在突发事件后能快速决策和恢复；并提供常见应用、数据库问题以及升级部署失败的相关解决方案，以便在出现问题后可以及时恢复；定期进行演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
RES07-01 定义关键指标与阈值并监控 - 云架构中心

以下4个黄金指标，是针对大量分布式监控的经验总结，可以作为业务监控的参考，包括：延迟：注意需要区分请求成功的延迟和请求失败的延迟。流量：对系统业务负荷的监控。错误率：注意区分显示失败（如HTTP 500错误）和隐式失败（如HTTP 200中包含了错误内容）。饱和度：侧重在对系统中最为受限的瓶颈资源的监控。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RabbitMQ性能优化 - 云架构中心
RabbitMQ性能优化 - 云架构中心

消息，以此来实现最少一次（at-least-once）的投递语义。注意，Confirm 机制同样会影响性能。控制未确认消息个数所有未确认的消息都会暂存在内存中，太多的未确认消息可能造成服务 OOM。为了限制未确认消息的规模，你可以在消费者端开启prefetch功能来限制消息拉取上限。持久化资源为

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
跨云容灾方案 - 云架构中心
跨云容灾方案 - 云架构中心

题时自动回滚。应急恢复处理制定应急处理机制，指定应急恢复人员，以便在突发事件后能快速决策和恢复；并提供常见应用、数据库问题以及升级部署失败的相关解决方案，以便在出现问题后可以及时恢复；定期进行演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
选择合适的计算资源 - 云架构中心

过度预配。考虑容器化与非容器化工作负载相比，容器具有性能优势。如果适合体系结构需求，请考虑使用容器化。容器可以通过隔离、资源效率、快速启动时间和可移植性来提高计算性能。使用容器时，请考虑设计因素，例如将所有应用程序组件容器化。将基于Linux的容器运行时用于轻型映像。为容器

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模
金融类核心应用典型部署架构（99.999%） - 云架构中心

题时自动回滚。应急恢复处理制定应急处理机制，指定应急恢复人员，以便在突发事件后能快速决策和恢复；并提供常见应用、数据库问题以及升级部署失败的相关解决方案，以便在出现问题后可以及时恢复；定期进行演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
双Region方案 - 云架构中心
双Region方案 - 云架构中心

题时自动回滚。应急恢复处理制定应急处理机制，指定应急恢复人员，以便在突发事件后能快速决策和恢复；并提供常见应用、数据库问题以及升级部署失败的相关解决方案，以便在出现问题后可以及时恢复；定期进行演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如RDS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。当RDS实例由

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

当带宽使用率高时，可根据业务情况，变更规格以支持更大带宽。应用层进行过载保护，保障优先业务的运行。生产消息失败检测：生产消息失败恢复：应用层进行重试，以应对暂时性故障；应用故障重试处理可参考“故障重试”。当多次重试后仍无法写入成功，可将数据写入本地缓存，待服务可用后再写入实例。当实例由于过载导致网络限制时，可参考“CPU

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。应用层进行过载保护，保障优先业务的运行。 OBS对象上传/下载失败检测：对象上传/下载失败。恢复：应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。当OBS桶由于过载导致网络限制时，可参考“OBS桶流量过载”的处理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。应用层进行过载保护，保障优先业务的运行。连接后端云数据库 TaurusDB失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如云数据库 TaurusDB实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
RES13 过载保护 - 云架构中心
RES13 过载保护 - 云架构中心

RES13 过载保护当系统流量超过一定阈值后，导致系统处于过载状态时，可能会导致部分请求失败，失败触发业务重试，会进一步增加系统的负荷，形成恶性循环，导致业务成功率远远低于系统的设计容量，甚至整体不可用。因此应用应该设计过载保护机制，使得在过载状态下依然可以保证一定比例设计容量的处理能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制
云运维中心(COC) - 云架构中心
云运维中心(COC) - 云架构中心

确定性故障管理统一事件中心：提供事件发现、事件处理、恢复验证及持续改进的全流程标准化机制。承载Warroom和故障回溯能力：现网事件智能启动Warroom，缩短故障处理非必要耗时，指挥中心实时观测故障处理进展。故障回溯实现问题总结和经验沉淀，客户问题不重犯，缩短故障恢复MTTR。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
变更防差错 - 云架构中心
变更防差错 - 云架构中心

变更防差错在系统的运行过程中，配置变更是导致生产系统不可用的重要风险之一，如配置修改、工作负载手工增缩或补丁安装等。当变更失败时，可能会导致性能下降或业务中断等严重的问题。因此为了降低变更带来的业务风险，需要为工作负载或其环境的更改做好准备，实现工作负载的可靠操作。变更操作属

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
RES13-03 过载检测与流量控制 - 云架构中心

RES13-03 过载检测与流量控制当应用系统发生过载时，可能会导致系统疲于处理请求而无法有效提供服务，因此需要进行过载检测并进行流量控制。风险等级高关键策略过载控制(也称流控)指系统处于过载时，通过限流、降级、熔断、弹性伸缩等手段，使系统保证部分或者全部额定容量业务成

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

Replication Service，简称DRS）创建灾备任务，当主实例所在区域发生突发性自然灾害等状况，主节点（Master）和备节点（Slave）均无法连接时，可将异地灾备实例切换为主实例，在应用端修改数据库链接地址后，即可快速恢复应用的业务访问。数据复制服务提供的实时灾备功能，可实现主实

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
内部知识管理类应用典型部署架构（99.9%） - 云架构中心

更新一次软件。应急恢复处理制定应急处理机制，指定应急恢复人员，以便在突发事件后能快速决策和恢复；并提供常见应用、数据库问题以及升级部署失败的相关解决方案，以便在出现问题后可以及时恢复。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用系统采用有状态虚拟机+有状态数据库的分层部署架构。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构

总条数： 102

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES12-04 出现问题后尽快恢复业务 - 云架构中心

可靠性功能 - 云架构中心

COST05-03 定期回顾和审核 - 云架构中心

跨云双活方案 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

RabbitMQ性能优化 - 云架构中心

跨云容灾方案 - 云架构中心

选择合适的计算资源 - 云架构中心

金融类核心应用典型部署架构（99.999%） - 云架构中心

双Region方案 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

RES13 过载保护 - 云架构中心

云运维中心(COC) - 云架构中心

变更防差错 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

可靠性功能 - 云架构中心

内部知识管理类应用典型部署架构（99.9%） - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线