搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。应用层进行过载保护，保障优先业务的运行。连接后端云数据库 TaurusDB失败检测：连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
RES15-03 自动化回滚 - 云架构中心

RES15-03 自动化回滚在升级或部署过程中出现异常，或检查/测试失败时，支持自动回滚，减少人工干预，避免回滚失败。风险等级高关键策略检测到异常后，可一键式回滚。回滚过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
成本优化云服务介绍 - 云架构中心

成本中心是华为云免费向用户提供的云财务管理服务，可帮助您收集华为云成本和使用量的相关信息、探索和分析华为云成本使用情况、监控和跟踪华为云成本，及时了解云支出的趋势和动因，减少异常支出，持续成本优化。费用中心为您提供财务信息、发票、合同、续费、退订和变更等服务，有助于更好的了解您的消费信息。同时费用中

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱
RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换针对有状态的主备类型业务，在跨AZ部署并支持自动切换时，需要对接容灾仲裁，以避免出现双主或双备，从而在AZ间链路中断的情况下，业务能自动切换到一个AZ提供服务而不受影响；对于集群类业务不涉及。风险等级高关键策略面向有状态主备类

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
云运维中心(COC) - 云架构中心
云运维中心(COC) - 云架构中心

持规则和流程解耦，保证变更执行过程不走样，同时将变更方案沉淀。变更审批：按照预设审批流程审批变更单，保障变更方案可靠性、时间合理性、流程合规性。风险评估：基于场景规则、流程规则、业务规则对变更进行管控，提前识别和拦截变更风险；通过变更日历实现变更冲突检测，降低服务间变更依赖导致的变更风险。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
信息管理类应用典型部署架构（99.95%） - 云架构中心

一定的恢复时间和恢复点，其可用性目标通常要求达到99.95%，即每年故障时长可以为4.38小时。假定故障中断与变更中断的时长分别如下：故障中断：假定每年故障中断4次，每次应急恢复决策时长为20分钟，恢复处理时长为10分钟，则每年故障中断时长为120分钟。变更中断：假定应用支

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
RES03-04 支持容灾管理 - 云架构中心

下的业务切换。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。支持应用级数据校验，比较AZ间数据同步差异，监控及PO指标。典型确定性故障场景下自动容灾或切换，无需人工接入，业务不受影响，满足RPO/RTO指标。典型亚健康故障场景，支持业务降级或主动切换，业务不持续受损。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率。恢复：根据业务情况，手工变更节点规格或增加节点数量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
RES04-03 容灾恢复过程自动化 - 云架构中心

容灾恢复过程自动化由于容灾恢复场景涉及容灾站点的业务恢复、数据库的主备切换、业务到容灾站点的流量切换等，恢复过程比较复杂，因此需要提供容灾管理功能，实现容灾状态及RPO监控，以及灾难场景下的一键式自动切换，减少人工干预。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
PERF04-01 定义验收标准 - 云架构中心

能涉及响应时间、吞吐量、资源利用率或任何其他相关绩效指标的指标。例如响应时间的目标可能低于特定阈值，如小于2秒。定义验收标准将性能目标转换为可用于评估工作负载性能的特定验收标准。例如，假设响应时间的性能目标是2秒或更短。接受条件可以是工作负载的平均响应时间应小于2秒。使用这些

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
SEC06-01 安全合规使用开源软件 - 云架构中心

源软件来开发和部署软件应用程序。开源软件的使用必须严格遵守合法合规的底线，包括开源软件的来源、漏洞管理、可追溯、归一化及生命周期管理等方面。风险等级高关键策略来源可靠。由于开源软件是公开的，因此黑客和攻击者可以更容易地找到其中的漏洞和安全隐患，从而进行攻击和入侵。确保引入

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
SEC09-03 实施安全审计 - 云架构中心

的文件校验，保障审计文件的完整性，防止文件被篡改。集中管控运维账号访问系统和资源的权限，对系统和资源的访问权限进行细粒度设置。关于数据的安全审计见：SEC07-03 对数据操作实施监控相关云服务和工具云审计服务 CTS：用户开通CTS后，系统会自动创建一个追踪器，该追踪器

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

当检测到主节点故障后，快速切换到备节点并自动恢复，在异常检测和恢复期间，可能会影响业务，时间在半分钟内。数据备份和恢复 DCS支持将当前时间点的实例缓存数据备份并存储到OBS中，以便在缓存实例发生异常后能够从备份数据进行恢复。DCS实例支持定时和手动两种备份方式，定时备份频率

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
韧性支柱简介 - 云架构中心
韧性支柱简介 - 云架构中心

面对各种异常场景时仍能提供和维持可接受的服务水平。韧性支柱结合了华为公司韧性设计经验和业界最佳实践，总结并提炼出一系列设计原则与最佳实践，用以帮助企业利用华为云平台基础设施达到高可用、面向各种故障场景进行韧性设计，并具备一定的灾备能力；同时通过规范化变更、部署及应急恢复等处理流程，减少业务中断时长，提升可用性。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
RES05-01 网络连接高可用 - 云架构中心

络链路，互为主备，并通过企业路由器，可以实现DC和VPN主备链路的自动切换，不需要手工切换双联路，不仅避免业务受损，同时降低维护成本。具体的方案参见“通过企业路由器构建DC/VPN双联路主备混合云组网”。相关云服务和工具云专线 DC 虚拟专用网络 VPN 父主题： RES05

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES05 网络高可用
SEC04-01 对网络划分区域 - 云架构中心

性要求的网络流量和资源，从而增加网络的安全性。风险等级高关键策略通过网络分区，可以实现以下目的：隔离敏感数据：将敏感数据和应用程序隔离在独立的网络分区中，以减少未经授权访问的风险。可扩展性：分区和分层可以帮助管理和扩展复杂的网络架构，使其更易于维护和扩展。限制网络流

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC04 网络安全
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

BMS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率恢复：根据业务情况，更换规格更高的BMS实例或增加BMS实例进行负荷分担。应用层进行过载保护，保障优先业务的运行。连接后端BMS失败检测：网络连接失败。恢复：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
什么是应用韧性 - 云架构中心
什么是应用韧性 - 云架构中心

响。 RDS数据库提供自动数据备份、跨AZ和跨Region的数据复制与切换。不过，即使应用系统利用云平台能力具有了这些高可用能力，要实现较高的可用性，仍需要构建针对各种偶发故障下的恢复能力，如：由于硬件故障导致的高可用切换或跨AZ切换过程中，导致瞬时链接中断，需要应用系统具备链接中断重试的功能。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
金融类核心应用典型部署架构（99.999%） - 云架构中心

999%，即每年故障时间可以为5.26分钟。假定故障中断与变更中断的时长分别如下：故障中断：由于要求的故障中断时间很短，要求尽可能自动恢复，没有手动触发的恢复，假定每年故障中断4次，每次自动恢复时长为1分钟，则每年故障中断时长为4分钟。变更中断：假定应用支持金丝雀部署或蓝绿部署，并自动完成，软件更新不中断业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

ECS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护，保障优先业务的运行。连接后端ECS失败

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器

总条数： 115

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

RES15-03 自动化回滚 - 云架构中心

成本优化云服务介绍 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

云运维中心(COC) - 云架构中心

信息管理类应用典型部署架构（99.95%） - 云架构中心

RES03-04 支持容灾管理 - 云架构中心

常见故障模式 - 云架构中心

RES04-03 容灾恢复过程自动化 - 云架构中心

PERF04-01 定义验收标准 - 云架构中心

SEC06-01 安全合规使用开源软件 - 云架构中心

SEC09-03 实施安全审计 - 云架构中心

可靠性功能 - 云架构中心

韧性支柱简介 - 云架构中心

RES05-01 网络连接高可用 - 云架构中心

SEC04-01 对网络划分区域 - 云架构中心

常见故障模式 - 云架构中心

什么是应用韧性 - 云架构中心

金融类核心应用典型部署架构（99.999%） - 云架构中心

常见故障模式 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线