搜索_华为云

RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换针对有状态的主备类型业务，在跨AZ部署并支持自动切换时，需要对接容灾仲裁，以避免出现双主或双备，从而在AZ间链路中断的情况下，业务能自动切换到一个AZ提供服务而不受影响；对于集群类业务不涉及。风险等级高关键策略面向有状态主备类

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

本，关联源代码版本和部署的应用版本，在运维阶段，一旦部署在云上的应用发生任何问题，可以方便回溯到源代码，而且方便使用上一版本的源代码回滚到上一版本的应用。其次，在软件开发生命周期内，推动开发人员采用代码质量最佳实践，例如，使用代码审查或结对编程等最佳实践来提高代码质量，确保每行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
OPS05 运维准备和变更管理 - 云架构中心

OPS05 运维准备和变更管理 OPS05-01 进行生产准备度评审（Product Readiness Review） OPS05-02 进行变更风控 OPS05-03 定义变更流程父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护，保障优先业务的运行。连接后端ECS失败检测：网络连接失败。恢复：至少部署2个后端ECS。对于无状态业务，配置ELB弹性负载均衡保障

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/磁盘IOPS使用率恢复：根据业务情况，更换规格更高的BMS实例或增加BMS实例进行负荷分担。应用层进行过载保护，保障优先业务的运行。连接后端BMS失败检测：网络连接失败。恢复：至少部署2个后端BMS。对于无状态业务，配置ELB弹性负载均衡保障业务可靠性；对于有状态业务，由应用层实现多实例高可用。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
信息管理类应用典型部署架构（99.95%） - 云架构中心

便在出现问题后可以及时恢复。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用系统采用无状态应用+有状态数据库的分层部署架构。该应用系统在华为云单个Region部署一套完整系统，采用跨AZ部署，可以实现云内应用层跨数据中心双活。接入层（外部DNS）：通过外部DN

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
PERF05-03 WEB场景资源优化 - 云架构中心

关键策略对于已经配置好的资源，可以通过优化来提高性能。例如，优化操作系统的设置、调整网络带宽、优化数据库查询等。云服务资源性能优化步骤包括: 识别性能瓶颈: 通过监控和分析云服务资源使用情况，找出性能瓶颈。优化资源配置: 根据性能瓶颈，调整云服务资源的配置，如 CPU 、内存、网络等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

系统会自动切换到只读节点，只读节点提升为主节点，原来故障的主节点也会自动恢复为只读节点。云数据库 TaurusDB服务还支持异构容灾实例(MySQL节点)，支持在极端场景，如社区未知bug、用户误操作、AZ级故障导致服务无法正常提供服务等场景，可以快速将服务切换到异构容灾实例继续提供服务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
OPS02-01 进行需求管理和迭代开发 - 云架构中心

同时从可维护性来看，较之于一次性颠覆性的大范围应用/软件更新，小步快跑，持续迭代地进行云上软件的更新更有利于运维，因为一则小范围的云上软件更新和部署更不容易引起大范围事故，其次，不停地迭代更新也有效地保证了开发，运维团队成员能够时刻处于练兵状态，不至于对运维的流程，最佳实践比较陌生。要

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
RES01-01 应用组件高可用部署 - 云架构中心

RES01-01 应用组件高可用部署应用系统内的所有组件均需要高可用部署，避免单点故障。风险等级高关键策略应用系统内各组件需要根据其具体能力，采用不同的高可用部署方案：使用原生高可用实例：当云服务既支持单节点资源，又支持主备或集群资源时，应用的关键节点应使用主备或集群

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

Service，简称DRS）创建灾备任务，当主实例所在区域发生突发性自然灾害等状况，主节点（Master）和备节点（Slave）均无法连接时，可将异地灾备实例切换为主实例，在应用端修改数据库链接地址后，即可快速恢复应用的业务访问。数据复制服务提供的实时灾备功能，可实现主实例和跨区域的灾备实例之间的单主灾备（详见“My

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
PERF06-03 自动告警 - 云架构中心

PERF06-03 自动告警风险等级中关键策略通过在云监控平台配置对应的告警策略，可以及时了解资源风险，以便做出对应调整和策略。相关云服务和工具：优化顾问 OA 云监控服务 CES 父主题：性能看护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
RES03-01 集群跨AZ部署 - 云架构中心

均衡能力，实现跨AZ高可用，在一个可用区故障时能自动快速切换。对于有状态ECS实例，或BMS实例，建议从应用层实现跨AZ容灾，支持跨AZ自动切换或通过容灾管理工具实现自动化容灾切换，减少灾难发生时的人工操作。对于已部署的应用系统改造为跨AZ实例的实施步骤：确定应用系统的关键

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
跨云容灾方案 - 云架构中心
跨云容灾方案 - 云架构中心

时可以快速切换到华为云。监控告警进行站点运行状态检查，在发生故障时告警；针对CCE、DCS、kafka、RDS、DDS等实例负载状态进行监控，在资源过载时需要告警。弹性扩缩容 CCE集群支持工作负载的自动弹性伸缩。变更防差错软件更新采用金丝雀或蓝绿部署，部署过程自动完成，在部署过程中出现问题时自动回滚。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
云运维中心(COC) - 云架构中心
云运维中心(COC) - 云架构中心

Procedure，简称SOP），将变更方案明确并电子化，经评审后归档。支持规则和流程解耦，保证变更执行过程不走样，同时将变更方案沉淀。变更审批：按照预设审批流程审批变更单，保障变更方案可靠性、时间合理性、流程合规性。风险评估：基于场景规则、流程规则、业务规则对变更进行管控，提前识别和拦截变更风险；通过

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
电商类应用典型部署架构（99.99%） - 云架构中心

0分钟，恢复处理时长为5分钟，则每年故障中断时长为45分钟。变更中断：假定应用支持金丝雀部署或蓝绿部署，并自动完成，软件更新不中断业务。按照以上评估，每年应用系统不可用的时长是45分钟，满足可用设计目标要求。电子商务类应用典型架构为前端无状态应用层+后端数据库，其中前端无状

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
PERF04-01 定义验收标准 - 云架构中心

能涉及响应时间、吞吐量、资源利用率或任何其他相关绩效指标的指标。例如响应时间的目标可能低于特定阈值，如小于2秒。定义验收标准将性能目标转换为可用于评估工作负载性能的特定验收标准。例如，假设响应时间的性能目标是2秒或更短。接受条件可以是工作负载的平均响应时间应小于2秒。使用这些

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
双Region方案 - 云架构中心
双Region方案 - 云架构中心

MySQL，可根据负载监控情况，自动扩缩规格或增删只读节点。变更防差错软件更新采用金丝雀或蓝绿部署，部署过程自动完成，在部署过程中出现问题时自动回滚。应急恢复处理制定应急处理机制，指定应急恢复人员，以便在突发事件后能快速决策和恢复；并提供常见应用、数据库问题以及升级部署失败的相关解决方案，以便在出现问

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率。恢复：根据业务情况，手工变更节点规格或增加节点数量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

关键策略 Production Readiness Review 生产准备度评估基线：从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度，对服务可用性及运维能力提出基线要求。在服务产品开发前端构筑能力，进行相关需求规划、设计和开发工作，并在服务上线前进行生产准入审视。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理

总条数： 178

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

OPS05 运维准备和变更管理 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

信息管理类应用典型部署架构（99.95%） - 云架构中心

PERF05-03 WEB场景资源优化 - 云架构中心

可靠性功能 - 云架构中心

OPS02-01 进行需求管理和迭代开发 - 云架构中心

RES01-01 应用组件高可用部署 - 云架构中心

可靠性功能 - 云架构中心

PERF06-03 自动告警 - 云架构中心

RES03-01 集群跨AZ部署 - 云架构中心

跨云容灾方案 - 云架构中心

云运维中心(COC) - 云架构中心

电商类应用典型部署架构（99.99%） - 云架构中心

PERF04-01 定义验收标准 - 云架构中心

双Region方案 - 云架构中心

常见故障模式 - 云架构中心

OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线