搜索_华为云

可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

双活或多活等。应用系统要达到可用性目标，需对应用系统内组件及依赖组件进行可用性要求分解，包括：对依赖组件的可用性要求：通常关键依赖组件需要比其他服务提高一个9的SLO目标，如应用系统SLO目标为99.9%，则关键依赖组件SLO目标要求达到99.99%。应用系统SLO分解：综

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
PERF03-03 使用弹性伸缩 - 云架构中心

关键策略如果工作负载能够支持弹性（例如：应用无状态化），请考虑具有自动缩放功能的计算服务，该功能可根据需求自动调整计算容量。自动缩放有助于确保在高峰期拥有足够的资源，并防止在低需求时段过度预配。虚拟机弹性伸缩和容器弹性伸缩都是实现应用自动化扩容和缩容的方式，但虚拟机弹性伸缩需要

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护，保障优先业务的运行。连接后端ECS失败检测：网络连接失败。恢复：至少部署2个后端ECS。对于无状态业务，配置ELB弹性负载均衡保障业务可靠性；对于有状态业务，由应用层实现多实例高可用。应用层进行重试，以应对暂时性故障，如

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
故障快速恢复 - 云架构中心
故障快速恢复 - 云架构中心

故障快速恢复当应用系统采用华为云服务的高可用设计时，在云服务实例发生故障后，云服务能自动检测和恢复；但对于应用系统本身的故障，需要应用系统自身进行检测和快速恢复处理，以保证系统能够正常运行，从而提高系统的可靠性和稳定性。 RES08 依赖减少与降级 RES09 故障重试 RES10

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
参考架构 - 云架构中心
参考架构 - 云架构中心

参考架构概述内部工具或公测类应用典型部署架构（99%）内部知识管理类应用典型部署架构（99.9%）信息管理类应用典型部署架构（99.95%）电商类应用典型部署架构（99.99%）金融类核心应用典型部署架构（99.999%）跨云场景典型部署架构（99.99%）父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
RES05 网络高可用 - 云架构中心
RES05 网络高可用 - 云架构中心

RES05 网络高可用应用系统对外或对内通信都依赖于网络，一旦网络异常将会导致业务中断，因此网络架构的高可用及容灾能力至关重要。在进行网络设计时，需要充分考虑应用系统对内和对外的网络连接、IP地址管理和域名解析等。华为云中网络高可用主要涉及三个场景：公有云网络：构建应用系统相关的公网

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
RES01 冗余 - 云架构中心
RES01 冗余 - 云架构中心

RES01 冗余 RES01-01 应用组件高可用部署 RES01-02 应用组件多位置部署 RES01-03 云服务器反亲和父主题：高可用设计

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

持更大存储空间。当带宽使用率高时，可根据业务情况，变更规格以支持更大带宽。应用层进行过载保护，保障优先业务的运行。生产消息失败检测：生产消息失败恢复：应用层进行重试，以应对暂时性故障；应用故障重试处理可参考“故障重试”。当多次重试后仍无法写入成功，可将数据写入本地缓存，待服务可用后再写入实例。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
RES08-01 减少强依赖项 - 云架构中心

依赖项长时间无法访问时，应用程序应能继续执行其核心功能，以便将局部故障对整体系统功能的影响减到最小。如所依赖的数据丢失时，应用程序仍能运行，但可以提供稍微陈旧的数据、替代数据，甚至没有数据，应用仍处于可预测和可恢复的状态。避免启动依赖及循环依赖。若应用系统由于某些原因导致重启时

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES10-04 健康检查与自动隔离 - 云架构中心

CCE：支持容器健康检查，容器运行过程中，可根据用户需要，定时检查容器健康状况。若不配置健康检查，如果容器内应用程序异常，Pod将无法感知，也不会自动重启去恢复。最终导致虽然Pod状态显示正常，但Pod中的应用程序异常的情况。父主题： RES10 故障隔离

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

以跨Region主备容灾为例，对于已在一个Region部署应用系统后，增加支持跨Region主备容灾能力的实施步骤建议如下：选择另一个Region作为灾备Region，部署一套相同的应用系统，包括工作负载、数据库实例等。针对应用系统内的关键数据，利用云服务或应用系统自身实现跨Region的数据复制。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES03 跨AZ容灾 - 云架构中心
RES03 跨AZ容灾 - 云架构中心

ity Zone，简称AZ）能力，应用可以用较小成本来完成容灾架构部署。应用系统可设计为使用分布在多个可用区中的资源池，并利用云服务实例本身具备或应用自身支持的跨AZ数据复制与切换能力，在多个AZ之间复制数据、负载均衡和跨AZ故障切换，从而使应用系统具备应对可用区故障的能力。 RES03-01

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
卓越运营云服务介绍 - 云架构中心

软件开发生产线(CodeArts）资源编排服务(RFS) 云运维中心(COC) 云监控中心(CES) 云日志服务(LTS) 应用运维管理(AOM2.0) 应用性能管理(APM) 云堡垒机(CBH) 应用管理与运维平台(ServiceStage) 多活高可用(MAS) 父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES08 依赖减少与降级 - 云架构中心

RES08 依赖减少与降级对于应用系统，需要识别和管理系统依赖项。应用系统设计人员需要维护对其他系统组件的依赖项的完整列表，包括系统内和系统外的所有依赖。应用系统应尽可能减少关键依赖项，即减少由于该依赖项不可用而导致服务中断的组件。 RES08-01 减少强依赖项 RES08-02

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
RES10 故障隔离 - 云架构中心
RES10 故障隔离 - 云架构中心

故障影响范围，防止产生级联故障。通过划分故障隔离域，限制工作负载的影响，可有效进行故障隔离。 RES10-01 应用控制平面与数据平面隔离 RES10-02 应用系统多位置部署 RES10-03 采用Grid架构 RES10-04 健康检查与自动隔离父主题：故障快速恢复

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
PERF06-02 性能劣化自动定界定位 - 云架构中心

化手段快速定位定界发现根因。可以通过应用模型建设三维的拓扑，把架构-空间-时间数据关联起来。这里面的关键是架构模型的建立及分层指标的聚合可视化能力，需要依赖持续的资源治理和数据治理。相关云服务和工具：优化顾问 OA 云监控服务 CES 应用运维管理 AOM 父主题：性能看护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

健康检查是指容器运行过程中，根据用户需要，定时检查容器健康状况。若不配置健康检查，如果容器内应用程序异常，Pod将无法感知，也不会自动重启去恢复。最终导致虽然Pod状态显示正常，但Pod中的应用程序异常的情况。 Kubernetes提供了三种健康检查的探针：存活探针：livenes

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
RES15-04 灰度部署和升级 - 云架构中心

控更改以便发现错误，直到所有部署完成。蓝绿部署与金丝雀部署类似，只是会并行部署一整套应用程序，形成两套生产环境：蓝环境和绿环境，蓝色是当前版本并拥有实时流量，绿色是包含更新代码的环境。当应用程序已经准备就绪，用户可以将所有流量都将路由到绿环境中，当出现问题时，可以快速将流量重新路由回蓝环境，进行故障恢复。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES07-01 定义关键指标与阈值并监控 - 云架构中心

饱和度：侧重在对系统中最为受限的瓶颈资源的监控。对于基于Java的应用系统，华为云用户可使用APM服务实现基于调用链的业务延迟和错误率监控。函数服务FunctionGraph、微服务引擎CSE提供了流量、延迟和错误率监控能力。基于API网关暴露接口的应用，可使用APIG服务提供的流量、延迟和错误率监

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES02 备份 - 云架构中心
RES02 备份 - 云架构中心

RES02 备份对于应用系统中的重要数据，需要提供备份功能，以便在病毒入侵、人为误删除、软硬件故障等场景，能够快速将数据恢复到备份点。由于容灾通常对数据采用实时复制且没有多备份点，在主数据被误删或误改的情况下，错误数据会同步到备端，从而无法达到数据备份的效果，因此通常不能使用容灾来代替备份。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计

总条数： 264

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

可用度及SLO - 云架构中心

PERF03-03 使用弹性伸缩 - 云架构中心

常见故障模式 - 云架构中心

故障快速恢复 - 云架构中心

参考架构 - 云架构中心

RES05 网络高可用 - 云架构中心

RES01 冗余 - 云架构中心

常见故障模式 - 云架构中心

RES08-01 减少强依赖项 - 云架构中心

RES10-04 健康检查与自动隔离 - 云架构中心

RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

RES03 跨AZ容灾 - 云架构中心

卓越运营云服务介绍 - 云架构中心

RES08 依赖减少与降级 - 云架构中心

RES10 故障隔离 - 云架构中心

PERF06-02 性能劣化自动定界定位 - 云架构中心

可靠性功能 - 云架构中心

RES15-04 灰度部署和升级 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

RES02 备份 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线