搜索_华为云

多活高可用(MAS) - 云架构中心
多活高可用(MAS) - 云架构中心

主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库，通过混沌实验编排攻击目标、攻击策略进行故障注入，支持添加背景流量和资源监控，同时在故障注入能力的基础上，通过体系化的流程和规范来创建故障演练，从而验证和提升系统可靠性和技术团队应急响应能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
PERF05-04 大数据场景资源优化 - 云架构中心

大数据场景资源优化风险等级中关键策略在大数据场景下，可以通过优化资源的使用和分配，提高系统的性能和效率。以下是一些常见的大数据场景资源优化方法：分布式存储：使用分布式存储系统，如Hadoop HDFS、Apache Cassandra等，将数据分散存储在多个节点上，以提高数据的可靠性和可扩展性。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
RES11-03 长稳测试 - 云架构中心
RES11-03 长稳测试 - 云架构中心

RES11-03 长稳测试基于用户使用场景构建业务模型，自动化构建覆盖系统容量规格70%的业务量，持续7*24小时进行长时间负载测试以评估系统稳定性。风险等级高关键策略模拟各种业务场景进行测试。持续自动测试。测试结果发生偏差时自动告警，以便及时定位和处理。父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES11-04 灾难演练 - 云架构中心
RES11-04 灾难演练 - 云架构中心

RES11-04 灾难演练通过容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略灾难演练着重测试服务跨AZ或跨Region故障转移能力，验证系统的容灾能力以及面对灾难时的应对能力，涉及到多个团队间配合，通常

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES10-04 健康检查与自动隔离 - 云架构中心

RES10-04 健康检查与自动隔离对应用组件进行健康检查，当发现故障后进行主动隔离，避免故障扩散。风险等级高关键策略对系统内组件需要定期进行健康检查，以判断其状态是否正常。对于异常组件，需要能支持自动隔离，避免对整体业务造成影响。相关云服务和工具弹性负载均衡器

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

目标通过定期的容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程计时，以确定应用系统的RPO与RTO目标能否满足。演练期

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
PERF06-02 性能劣化自动定界定位 - 云架构中心

PERF06-02 性能劣化自动定界定位风险等级中关键策略通过建立的分层性能模型，判断系统是否会出现性能劣化的情况。当出现劣化事件时，需要通过自动化手段快速定位定界发现根因。可以通过应用模型建设三维的拓扑，把架构-空间-时间数据关联起来。这里面的关键是架构模型的建立及分层

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
RES11-02 压力负载测试 - 云架构中心

RES11-02 压力负载测试通过施加超出系统容量的业务压力，验证云服务的过载保护、业务隔离和优雅降级等能力。为全面验证系统整体的容量规划和业务依赖，云服务应用通常采用全链路压测进行测试。风险等级高关键策略模拟大量接口消息进行压力测试。模拟各种业务场景进行压力测试。持续自动测试。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
PERF04-06 建立性能可观测性体系 - 云架构中心

除等功能的一套完整的解决方案。性能可观测体系在此基础上突出了性能指标，通过收集和分析性能数据，可以识别系统瓶颈、优化资源分配等，找到性能优化方向。性能监控对象：服务器、操作系统、数据库、应用程序、网络设备、云服务。常见性能指标：包括资源CPU、内存，硬盘等，及程序的响应时间、吞吐量、并发数等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 建立性能可观测性体系
OPS03-01 推行开发者测试 - 云架构中心

赖低，也是在软件系统运维之前成本最低的发现软件问题的方式，尤其是各种异常场景或者用户输入，开发者测试的过程实际上“强制”了开发者去思考线上业务可能出现的场景，从而有利于减轻后续运维阶段系统的负担。此外，云上的软件是不断演进和重构的，很多时候我们不敢修改已有系统代码的原因，就是不

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
OPS08-03 知识管理 - 云架构中心
OPS08-03 知识管理 - 云架构中心

包括网络配置、服务器管理、数据库维护等方面的知识。下面将介绍运维知识库系统的五个主要功能和优势。丰富的知识资源：运维知识库系统收集整理了大量的运维知识和经验，涵盖了各个领域和层次的内容。用户可以通过系统进行检索，查找到相关的知识和解决方案。不仅可以解决一些常见的问题，还可以提

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
RES02-01 识别和备份应用中所有需要备份的关键数据 - 云架构中心

影响，则不需要进行备份。风险等级高关键策略识别应用系统中的所有数据。数据可以存储在多种资源中，如ECS/BMS中的卷、RDS/DDS等数据库、SFS文件系统、OBS对象存储等。根据重要性对数据进行分类。应用系统内的不同数据具有不同的重要程度，对备份的要求也不同；如对一些

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
RES01-01 应用组件高可用部署 - 云架构中心

业务自动恢复的功能，并能容忍虚拟机HA期间业务处理性能短暂下降或中断。对已部署的应用系统，改造为支持高可用能力的实施步骤：确定应用系统的关键组件；所谓关键组件是指一旦故障，会导致整个应用系统或其中的关键功能受损。针对关键组件，检查其高可用能力，即在其故障的情况下，是否能自动故障转移，进行业务恢复。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES08-02 依赖松耦合 - 云架构中心

RES08-02 依赖松耦合系统内组件之间直接访问时，会产生紧耦合关系一个组件的状态变化会对其他组件产生直接影响，从而会导致所有组件的可用性均下降。而采用松耦合架构时，各个组件之间的依赖关系非常弱，它们可以独立地进行修改和扩展，而不影响其他组件；系统更加灵活，易于维护和升级，并且稳定性和可靠性也更强。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
PERF02-02 容量规划 - 云架构中心

用或服务添加到系统中，那么容量预测模型就需要考虑这些新的容量需求。预测与工作负载目标的一致性，可确保充分预配资源，防止资源浪费或工作负载过载。确定资源需求根据需求和预测分析的结果，进行容量评估和规划。确定系统所需的计算资源、存储资源和网络带宽等资源，以满足系统的性能要求。计

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
RES08-01 减少强依赖项 - 云架构中心

对整体系统功能的影响减到最小。如所依赖的数据丢失时，应用程序仍能运行，但可以提供稍微陈旧的数据、替代数据，甚至没有数据，应用仍处于可预测和可恢复的状态。避免启动依赖及循环依赖。若应用系统由于某些原因导致重启时，若依赖于其他依赖项启动或加载关键配置数据，可能会导致应用系统长时间停

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES13-06 压力负载测试 - 云架构中心

RES13-06 压力负载测试通过压力测试，可衡量系统的弹性扩容能力是否能满足业务要求。风险等级高关键策略参见“RES11-02 压力负载测试”章节。父主题： RES13 过载保护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
应用性能管理(APM) - 云架构中心

您无需修改代码，只需为应用安装一个APM Agent，就能够对该应用进行全方位监控，帮助您快速定位出错接口和慢接口、重现调用参数、发现系统瓶颈，从而大幅提升线上问题诊断的效率。目前支持JAVA、Python、Node.js、Go、Php和.Net应用，具体的应用监控能力概览如下表。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
概念表 - 云架构中心
概念表 - 云架构中心

Recovery Point Objective，主要指的是业务系统所能容忍的数据丢失量恢复时间目标 RTO Recovery Time Objective，主要指的是所能容忍的业务停止服务的最长时间，也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。业界对韧性没有统一的定

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
RTO与RPO - 云架构中心
RTO与RPO - 云架构中心

电子传输及完整设备支持：少量数据丢失，备用数据系统就绪，数据定时传送，备用网络就绪数小时至2天数小时至1天 5 实时数据传输及完整设备支持：数据丢失趋于0，备用数据系统就绪，远程数据复制，备用网络就绪数分钟至2天 0至30分钟 6 数据零丢失和远程集群支持：数据零丢失，自动系统故障切换，远程磁盘镜像，备用网络active

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义

总条数： 260

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

多活高可用(MAS) - 云架构中心

PERF05-04 大数据场景资源优化 - 云架构中心

RES11-03 长稳测试 - 云架构中心

RES11-04 灾难演练 - 云架构中心

RES10-04 健康检查与自动隔离 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

PERF06-02 性能劣化自动定界定位 - 云架构中心

RES11-02 压力负载测试 - 云架构中心

PERF04-06 建立性能可观测性体系 - 云架构中心

OPS03-01 推行开发者测试 - 云架构中心

OPS08-03 知识管理 - 云架构中心

RES02-01 识别和备份应用中所有需要备份的关键数据 - 云架构中心

RES01-01 应用组件高可用部署 - 云架构中心

RES08-02 依赖松耦合 - 云架构中心

PERF02-02 容量规划 - 云架构中心

RES08-01 减少强依赖项 - 云架构中心

RES13-06 压力负载测试 - 云架构中心

应用性能管理(APM) - 云架构中心

概念表 - 云架构中心

RTO与RPO - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线