搜索_华为云

设计原则 - 云架构中心
设计原则 - 云架构中心

要综合考虑冗余对成本的影响。故障全面检测故障检测是故障管理的前提，检测全面与检测快速都很重要，通常情况下故障检测全比故障检测快重要。故障检测涉及以下方面：检测范围：识别并跟踪检测所有组件，有重大影响的故障模式需要重点检测。亚健康检测：对不引起系统故障却导致系统或服务KP

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ELB的并发连接数/新建连接数/带宽使用率过高检测：通过CES监控ELB的并发连接数/新建连接数/带宽使用率。恢复：根据业务情况，采用独享型负载均衡器，并手工调整ELB负载均衡器规格。父主题： ELB弹性负载均衡

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

ECS实例或挂载的磁盘或数据被意外删除检测：NA 恢复：对于无状态业务，使用模板快速发放新实例；对于有状态业务，使用CBR云备份服务对ECS进行定期备份，在数据被删除时使用备份数据快速恢复。 ECS实例使用本地盘时本地盘故障检测：应用层检测本地盘运行状态。恢复：应用层采用RA

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

应用层进行过载保护，保障优先业务的运行。 OBS对象上传/下载失败检测：对象上传/下载失败。恢复：应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。当OBS桶由于过载导致网络限制时，可参考“OBS桶流量过载”的处理。 OBS桶内数据被误删检测：NA 恢复：针对OBS桶启用多

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA Kafka实例通过副本冗余方式实现实例容灾，当检测到leader副本故障后，快速完成副本选主，保障Kafka实例持续提供服务。 RabbitMQ集群提供镜像队列，通过镜像在其他节点同步数据。单节点宕机时，仍可通过唯一的访问地址对外提供服务。 RocketMQ

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 CPU /内存/磁盘/带宽使用率过高检测：通过CES监控CPU /内存/磁盘/带宽使用率。恢复：当CPU/内存使用高时，可根据业务情况，手工修改代理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据持久性 OBS通过存储介质的慢盘/坏道检测、AZ内设备和数据冗余、AZ之间数据容灾、跨区域复制等技术方案，提供针对介质、服务器、机柜、数据中心和区域的多级可靠性保障。其数据持久性高达99.9999999999%（12个9），可用性高达99.995%，远高于传统架构。详见“OBS的持久性和可用性如何

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 GaussDB(for MySQL)的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > GaussDB(for MySQL)云数据库
RES12-04 出现问题后尽快恢复业务 - 云架构中心

监控：应用系统需要提供业务监控信息，以便实时了解系统运行状态；维护团队需要有专人观测，并在发现故障发生时，需要及时响应。告警：应用系统在检测到故障后需要及时告警，并能通过短消息、邮件等方式发送给所有相关人员，确保使相关人第一时间得知故障信息，以便快速组织应急响应。预测：维护团

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
概念表 - 云架构中心
概念表 - 云架构中心

安全风险是指在面临安全威胁的情况下，系统、网络或数据可能遭受损害或丧失机密性、完整性或可用性的概率和影响程度。安全风险通常由威胁的存在、系统漏洞、不恰当的安全措施或其他因素造成。安全风险通常通过风险评估来评估和管理，以确定风险的程度并采取相应的控制措施。 Playbook 处置剧本

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基本概念
SEC09-02 安全事件记录及分析 - 云架构中心

在发生安全事件之前，可以考虑构建取证能力来支持安全事件调查工作。记录攻击和异常行为并对其分析：应在关键网络节点处（例如内外网的交界处、ELB流量转发处等）检测、防止或限制网络攻击行为；应采取技术措施对采集的安全日志进行持续监控和分析，实现对网络攻击特别是新型网络攻击行为和异常行为的识别和分析。风险等级

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
故障快速恢复 - 云架构中心
故障快速恢复 - 云架构中心

故障快速恢复当应用系统采用华为云服务的高可用设计时，在云服务实例发生故障后，云服务能自动检测和恢复；但对于应用系统本身的故障，需要应用系统自身进行检测和快速恢复处理，以保证系统能够正常运行，从而提高系统的可靠性和稳定性。 RES08 依赖减少与降级 RES09 故障重试 RES10

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
OPS06-05 实施依赖项遥测 - 云架构中心

的运行状况及性能。提供有关与 DNS、数据库或第三方 API 等依赖项相关的可访问性、超时及其他关键事件的高价值指标采集。当对应用程序进行检测，以发布有关这些依赖项的指标、日志和跟踪时，就能更清楚地了解可能影响工作负载的潜在瓶颈、性能问题或故障。父主题： OPS06 可观测性体系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES05-01 网络连接高可用 - 云架构中心

网络链路冗余：网络连接需要支持多路径，以实现高可用能力，以避免在一条网络路径中断的情况下，业务能切换到其他路径继续通信。网络链路快速倒换：需要定期检查网络链路的连通性，但检测到失败时需要尽快切换到正常路径。公有云组网场景可通过多EIP 弹性IP及DNS域名解析实现网络连接的高可用；对可用性要求较高的场景，需要

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES05 网络高可用
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

避免暴露不必要的网络地址不同流量模型业务的网络共享带宽隔离预留IP资源以便扩展和高可用 RES06您如何进行故障检测处理？故障模式分析面向所有故障进行检测支持亚健康检测 RES07 您如何监控应用系统资源？定义关键指标与阈值并监控日志统计监控监控到异常后发送消息通知监控数据存储和分析

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
组织级参考架构 - 云架构中心
组织级参考架构 - 云架构中心

统一部署具备跨账号安全管控的服务，如安全云脑SecMaster、企业主机安全HSS、数据安全中心DSC、数据加密服务DEW、云证书服务CCM、漏洞管理服务CodeArts Inspector、配置审计Config等云审计服务CTS 日志账号集中存储和查看所有账号的审计日志和安全相

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 参考架构
韧性支柱 - 云架构中心
韧性支柱 - 云架构中心

韧性支柱韧性支柱简介基本概念设计原则问题和检查项高可用设计故障全面检测故障快速恢复过载控制变更防差错参考架构云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践
责任共担模式 - 云架构中心
责任共担模式 - 云架构中心

客户责任：客户可以从华为云选择合适的产品并进行可靠性配置以符合应用韧性目标，并参考本白皮书中的设计原则与最佳实践，充分考虑各种异常场景的检测和恢复能力，来构建高可用应用系统。父主题：基本概念

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
概述 - 云架构中心
概述 - 云架构中心

备份应用数据被破坏的情况下的恢复能力容灾在Region/AZ/IDC或其他云站点发生灾难的情况下的恢复能力监控告警应用系统故障后的检测和告警能力弹性扩缩容应用容量不足时的自动恢复能力变更防差错变更对应用业务中断的影响应急恢复处理应用在故障情况下的应急恢复能力父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构

总条数： 100

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

设计原则 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

RES12-04 出现问题后尽快恢复业务 - 云架构中心

概念表 - 云架构中心

SEC09-02 安全事件记录及分析 - 云架构中心

故障快速恢复 - 云架构中心

OPS06-05 实施依赖项遥测 - 云架构中心

RES05-01 网络连接高可用 - 云架构中心

问题和检查项 - 云架构中心

组织级参考架构 - 云架构中心

韧性支柱 - 云架构中心

责任共担模式 - 云架构中心

概述 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线