搜索_华为云

可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

Service，简称DRS）创建灾备任务，当主实例所在区域发生突发性自然灾害等状况，主节点（Master）和备节点（Slave）均无法连接时，可将异地灾备实例切换为主实例，在应用端修改数据库链接地址后，即可快速恢复应用的业务访问。数据复制服务提供的实时灾备功能，可实现主实例和跨区域的灾备实

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
RES09 故障重试 - 云架构中心
RES09 故障重试 - 云架构中心

试机制。云中故障需要重试的典型场景有：实例主备切换时可能会导致连接中断，如DCS、RDS实例由于某些原因主备切换时，会导致连接中断，需要客户端重试。实例由于故障重启可能会导致通信中断，如ECS所在物理服务器由于硬件原因故障时，ECS重启或在其他物理服务器中自动恢复，恢复过程中与ECS的通信会中断，需要重试。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
概述 - 云架构中心
概述 - 云架构中心

应用内组件的高可用能力，在应用内部分节点故障时业务自动恢复能力备份应用数据被破坏的情况下的恢复能力容灾在Region/AZ/IDC或其他云站点发生灾难的情况下的恢复能力监控告警应用系统故障后的检测和告警能力弹性扩缩容应用容量不足时的自动恢复能力变更防差错变更对应用业务中断的影响应急恢复处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
跨云双活方案 - 云架构中心
跨云双活方案 - 云架构中心

RDS、DDS数据库自动备份，在数据故障时使用最新备份数据恢复，可以满足可用性目标要求。容灾应用跨AZ部署，AZ故障时自动恢复；支持跨云双活，在IDC或其他云出现故障时可以快速切换到华为云。监控告警进行站点运行状态检查，在发生故障时告警；针对CCE、DCS、kafka、R

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
RES13-01 采用自动弹性扩缩容 - 云架构中心

系统设计时一般建议采用横向伸缩。采用横向伸缩时，要求业务与数据解耦，即将系统的业务处理逻辑与数据分离、数据（状态）外置，以实现业务节点（含资源）无状态，按需快速增加或减少，从而实现系统业务处理能力的伸缩。当节点故障或资源不足时，系统需要自动检测和扩展节点，以实现自动横向扩缩

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
COST05-03 定期回顾和审核 - 云架构中心

回顾和审核的频率应该综合考虑多种因素，包括成本优化在企业或者组织中的重要性，测试和验证成本，应用的复杂性和优化变更的难易程度。同时，在每次回顾和审核时，持续改进流程，例如，通过降低测试和变更的成本从而提升整体的优化频率。最后，在云厂商新的服务、资源类型和配置推出后，也可以启动流程，对它们进行评估，以优化您的工作负载成本。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

承载业务流量。详见“健康检查介绍”。跨AZ容灾 ELB采用集群化部署，支持多可用区的同城多活容灾，无缝实时切换。 ELB支持后端服务器多AZ部署，当某个AZ出现故障时，ELB仍可将流量转发到其他AZ的后端ECS处理，提高应用系统容灾能力。监控告警配合CES服务，支持对EL

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
云运维中心(COC) - 云架构中心
云运维中心(COC) - 云架构中心

风险评估：基于场景规则、流程规则、业务规则对变更进行管控，提前识别和拦截变更风险；通过变更日历实现变更冲突检测，降低服务间变更依赖导致的变更风险。实施保障：按预定方案执行变更，变更步骤标准化、可观测，变更异常及时介入处理，实现变更实施全过程可控、可视、可管。确定性故障管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA DCS服务提供主备、Proxy集群、Cluster集群实例，通过节点冗余方式实现实例容灾，当检测到主节点故障后，快速切换到备节点并自动恢复，在异常检测和恢复期间，可能会影响业务，时间在半分钟内。数据备份和恢复 DCS支持将当前时间点的实例缓存数据备份并存储

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

生产站点发生灾难时，需要在异地灾备Region新部署一套业务系统并使用最新备份数据恢复数据，并恢复业务。主备容灾：生产站点与华为云灾备Region各部署一套业务系统，并将生产站点的重要数据异步复制到灾备Region；平常只有生产站点提供业务，当生产站点发生灾难时，将灾备Regi

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
设计原则 - 云架构中心
设计原则 - 云架构中心

断改进的艺术。只有不断从已有事故中学习经验，持续学习和改进，才能最终达到卓越运营。故而，团队应该培养持续学习和改进的文化，此外，在事故发生时，应该以对事不对人的态度，思考系统的改进，而不是惩罚或者指责个人。片面指责个人或者直接处罚的做法很容易引起一系列后果，例如后续的运维团队成员

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES03 跨AZ容灾 - 云架构中心
RES03 跨AZ容灾 - 云架构中心

或应用自身支持的跨AZ数据复制与切换能力，在多个AZ之间复制数据、负载均衡和跨AZ故障切换，从而使应用系统具备应对可用区故障的能力。 RES03-01 集群跨AZ部署 RES03-02 跨AZ数据同步 RES03-03 对接容灾仲裁，支持自动切换 RES03-04 支持容灾管理父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

有效落地持续集成 2. 采用持续部署模型 3. 基础设施即代码 4. 自动化工程运维任务 OPS05 是否有运维准备和变更管理体系？ 1. 进行生产准备度评审 2. 进行变更风控 3. 定义变更流程 OPS06 是否建立了完备的可观测体系？ 1.建立可观测体系 2.定义可观测对象 3.制定和实施可观测性指标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
卓越运营支柱 - 云架构中心
卓越运营支柱 - 云架构中心

建立持续改进的团队文化和标准化的运维体系 OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 OPS03 完备的测试验证体系 OPS04 自动化构建和部署流程 OPS05 运维准备和变更管理 OPS06 可观测性体系 OPS07 进行故障分析和管理 OPS08 度量运营状态和持续改进

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践
人工智能性能优化 - 云架构中心

在这个tensor的生命周期消失触发address释放时，发现其所属block有其他stream信息，此时会给对应stream下发一个event_record task然后返回。在之后本stream在每一次新申请内存时，均做一下event_query操作，如果发现event已

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
RTO与RPO - 云架构中心
RTO与RPO - 云架构中心

基本支持：基本支持备份介质并场外存放 2天以上 1天至7天 2 备用场地支持：有备份场地，能调配所有资源 24小时以上 1天至7天 3 电子传输和设备支持：关键数据定时传送，备用网络部分就绪 12小时以上数小时至1天 4 电子传输及完整设备支持：少量数据丢失，备用数据系统就绪，数据定时传送，备用网络就绪

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
什么是应用韧性 - 云架构中心
什么是应用韧性 - 云架构中心

RDS数据库提供自动数据备份、跨AZ和跨Region的数据复制与切换。不过，即使应用系统利用云平台能力具有了这些高可用能力，要实现较高的可用性，仍需要构建针对各种偶发故障下的恢复能力，如：由于硬件故障导致的高可用切换或跨AZ切换过程中，导致瞬时链接中断，需要应用系统具备链接中断重试的功能。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

过载检测与流量控制支持主动扩容资源自动扩容考虑了配额限制压力负载测试 RES14 您如何进行配置防差错？变更防呆检查自动化变更变更前数据备份提供runbook进行标准化变更 RES15 您如何进行升级不中断业务？自动化部署和升级自动化检查自动化回滚灰度部署和升级父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
SEC02-04 一体化身份管理 - 云架构中心

邦，统一身份管理系统中的用户身份可以同时访问私有云和公有云平台。统一身份管理系统与公司的HR流程结合，当员工入职、调岗和离职时可以触发用户的创建、变更和删除。针对Landing Zone搭建的云上多账号环境，利用IAM身份中心集中管理多个账号的用户身份，并集中为这些用户配置能

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC02 身份认证
电商类应用典型部署架构（99.99%） - 云架构中心

99.99%，即每年故障时间可以为52.56分钟。假定故障中断与变更中断的时长分别如下：故障中断：假定每年故障中断3次，每次应急恢复决策时长为10分钟，恢复处理时长为5分钟，则每年故障中断时长为45分钟。变更中断：假定应用支持金丝雀部署或蓝绿部署，并自动完成，软件更新不中断业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构

总条数： 103

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

可靠性功能 - 云架构中心

RES09 故障重试 - 云架构中心

概述 - 云架构中心

跨云双活方案 - 云架构中心

RES13-01 采用自动弹性扩缩容 - 云架构中心

COST05-03 定期回顾和审核 - 云架构中心

可靠性功能 - 云架构中心

云运维中心(COC) - 云架构中心

可靠性功能 - 云架构中心

RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

设计原则 - 云架构中心

RES03 跨AZ容灾 - 云架构中心

问题和检查项 - 云架构中心

卓越运营支柱 - 云架构中心

人工智能性能优化 - 云架构中心

RTO与RPO - 云架构中心

什么是应用韧性 - 云架构中心

问题和检查项 - 云架构中心

SEC02-04 一体化身份管理 - 云架构中心

电商类应用典型部署架构（99.99%） - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线