搜索_华为云

RES02-01 识别和备份应用中所有需要备份的关键数据 - 云架构中心

不同数据的重要性不一样，针对应用系统内的所有数据，需要明确其重要性及对应的RPO/RTO指标要求。比如对于重要数据，通常允许数据丢失的时间会比较少，从而需要更频繁的备份；对于一般的数据，允许数据丢失的时间比较长，可以使用较低的备份频率；对于一些不重要的数据，其数据丢失对业务没有影响，则不需要进行备份。风险等级

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

点冗余方式实现实例容灾，当检测到主节点故障后，快速切换到备节点并自动恢复，在异常检测和恢复期间，可能会影响业务，时间在半分钟内。数据备份和恢复 DCS支持将当前时间点的实例缓存数据备份并存储到OBS中，以便在缓存实例发生异常后能够从备份数据进行恢复。DCS实例支持定时和手动两种

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
RabbitMQ性能优化 - 云架构中心
RabbitMQ性能优化 - 云架构中心

bbitMQ 会把消息转存到磁盘，转存过程会耗费大量时间，造成消息处理速度下降或直接阻塞生产流程。因此队列中堆积过多的消息容易对 broker 产生负面效应。除此之外，如果节点崩溃后重启，过多的数据会使得重建索引需要消耗大量时间，集群模式下的节点间同步数据也会非常耗时。使用惰性队列提升稳定性

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
卓越运营支柱简介 - 云架构中心

高质量的交付结果，推动了持续集成和持续交付（CI/CD）落地；同时助力打造确定性运维体系，让研发团队将更多时间用在构建让客户受益的新功能上，减少用于维护和处理突发事件的时间，从而带来运行良好的系统和平衡的工作负载，尤其是卓越的客户体验。卓越运营支柱融合了这些优秀实践，聚焦如何正确

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES02-03 定期进行备份数据恢复 - 云架构中心

RES02-03 定期进行备份数据恢复通过定期恢复测试，可以验证备份数据的完整性与恢复处理过程是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略定期执行备份数据恢复，以验证备份的完整性。为了避免备份恢复对生产业务造成影响，可以构建

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
OPS06-03 制定和实施可观测性指标 - 云架构中心

OPS06-03 制定和实施可观测性指标风险等级高关键策略指标是对时间周期内的测量数据的数值表示。可观测性指标是围绕发现率、定级准确率、定界时长、覆盖率、有效率、一致率打造可观测能力，将可观测设计规范统一发布，统一设计要求与运维管理要求。设计建议整体技术方案会变成标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
基础概念 - 云架构中心
基础概念 - 云架构中心

性能性能是指软件系统或软件对应其及时性要求的符合程度。及时性用响应时间或吞吐量来衡量。响应性响应性是系统实现其响应时间或吞吐量目标的能力。响应时间（RT）用户感受系统为其服务所耗费的时间。不同业务系统的响应时间期望值不同，如互联网业务多为500ms以下、金融业务1s以下等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
PERF05-01 设计优化 - 云架构中心

们的处理时间，在给定时间范围内，随机分散到不同时间，以解决这个问题。空间换时间通过使用更多的存储空间，以节省执行时间。空间换时间包括简单地预先存储结果，或者存储经常被访问的数据以方便计算；另一种空间换时间则包括选择特定的算法，如HASH算法就是一种典型的空间换时间的算法。另

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 设计优化
OPS04-02 采用持续部署模型 - 云架构中心

选择这两种模型时，部署的每个阶段之间的时间应该足够长，以便能够监控工作负载的运行状况指标。应该提供充足的部署间隔时间（即部署组之间的时间），以确保来自不同区域的用户或执行不同任务的用户有时间使用工作负载。间隔时间应以小时和天而不是分钟来衡量。每个部署组的间隔时间也应该增加，以便考虑不同的时区和使用模式。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
设计原则 - 云架构中心
设计原则 - 云架构中心

迟时，执行并行处理。分散负载原则：通过在不同时间或者不同位置处理冲突负载，从而分散负载：将资源划分为成一些相对独立的小资源组，不同进程/线程可以独立访问，是“资源”分散的常见方案；将同一时间点的多个请求分散到一个时间区段，是“时间”分散的方案。父主题：性能效率支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
概念表 - 云架构中心
概念表 - 云架构中心

Objective，主要指的是业务系统所能容忍的数据丢失量恢复时间目标 RTO Recovery Time Objective，主要指的是所能容忍的业务停止服务的最长时间，也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。业界对韧性没有统一的定义。狭义韧性，指的是自动或快

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
Serverless性能优化 - 云架构中心

参考配置网络。超时时间如果函数配置的超时时间比较长的话，且函数代码中发生异常导致阻塞，函数同步调用会等待直到超出超时时间才返回超时异常，造成业务卡顿，长时间不退出等问题，无法实现failfast，影响业务体验。建议结合业务实际场景配置超时时间，避免超时时间配置过大。 Serverless函数代码最佳实践

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
性能数据采集 - 云架构中心
性能数据采集 - 云架构中心

影响：如果没有数据驱动的见解，你可能不知道潜在的性能问题或优化机会。潜在结果包括响应时间变慢、吞吐量降低、资源使用率增加，最终用户体验欠佳。此外，由于缺少性能数据，因此难以及时诊断和排查问题，从而导致停机时间延长并降低工作效率。 PERF04-04 资源性能数据收集 PERF04-05

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析
OPS01-02 规划标准化的运维组织 - 云架构中心

方式，例如规定不同团队的响应时间、服务级别目标（SLO) 或服务等级协议(SLA），同时应该记录团队间沟通信息，确保有足够的数据用于后续的改进。例如一种运维组织设计是：将运维组织分为一线、二线和三线阶梯型运维支持团队，一线受理客户的服务请求，第一时间将大部分的服务请求闭环。二线

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
RES04-01 定义应用系统的容灾目标RPO与RTO - 云架构中心

比如对于核心业务，通常需要保障业务的连续性，允许业务中断的时间会比较少，从而需要保障故障场景下的业务快速恢复，可采用双活/多活容灾；对于重要业务，允许一定的业务中断时间，可采用主备容灾；对于一般业务，允许中断的业务时间可达到天级，则可采用远程备份；对于一些不重要的业务，其业务中

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES06-02 面向所有故障进行检测 - 云架构中心

线上的cycle by cycle的比较，到最终发送到网络上结果的比较。时间检测：时间检测是故障检测的一种简单形式。如果一个事件预期应在某个时间段内发生，而却没有在该时间段发生，就检测到了一个故障。时间检测的一种特殊方法通常称为心跳方法。它采用以某个规定的周期频率执行的某些类型

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
COST07-02 释放闲置资源 - 云架构中心

风险等级中关键策略持续监控资源的闲置情况（如ELB无流量，EVS盘无挂载，EIP没有绑定到虚机），释放资源，或者监控资源使用只是在某个固定的时间(如每天的十二点，每个周末），可以使用自动化的方式定期申请资源，使用后释放相关服务和工具华为云优化顾问，提供成本维度的巡检，识别ECS、EIP、EVS、ELB等闲置资源。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST07 管理和优化资源
OPS05-03 定义变更流程 - 云架构中心

变更发起：在变更发起前，需明确变更内容与变更原因等信息。信息的明确可减轻变更评估人的工作量，同时明确变更的意义。变更信息包括：基本信息：标题、时间、变更人、原因等。变更信息：变更系统、变更场景、变更类型等。变更方案：变更实施方案、回滚方案、验证方案等。变更审批：由于变更系统相关

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
RES11-03 长稳测试 - 云架构中心
RES11-03 长稳测试 - 云架构中心

RES11-03 长稳测试基于用户使用场景构建业务模型，自动化构建覆盖系统容量规格70%的业务量，持续7*24小时进行长时间负载测试以评估系统稳定性。风险等级高关键策略模拟各种业务场景进行测试。持续自动测试。测试结果发生偏差时自动告警，以便及时定位和处理。父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
OPS08-01 使用度量指标衡量运营目标 - 云架构中心

临的挑战。并明确运营目标的关键绩效指标 (KPI)，可能是客户满意度、TTM、平均问题解决时间等等。根据 KPI，识别关键指标和数据源。客户满意度可能是各种指标的组合，例如呼叫等待或响应时间、满意度评分以及提出的问题类型。父主题： OPS08 度量运营状态和持续改进

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进

总条数： 117

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES02-01 识别和备份应用中所有需要备份的关键数据 - 云架构中心

可靠性功能 - 云架构中心

RabbitMQ性能优化 - 云架构中心

卓越运营支柱简介 - 云架构中心

RES02-03 定期进行备份数据恢复 - 云架构中心

OPS06-03 制定和实施可观测性指标 - 云架构中心

基础概念 - 云架构中心

PERF05-01 设计优化 - 云架构中心

OPS04-02 采用持续部署模型 - 云架构中心

设计原则 - 云架构中心

概念表 - 云架构中心

Serverless性能优化 - 云架构中心

性能数据采集 - 云架构中心

OPS01-02 规划标准化的运维组织 - 云架构中心

RES04-01 定义应用系统的容灾目标RPO与RTO - 云架构中心

RES06-02 面向所有故障进行检测 - 云架构中心

COST07-02 释放闲置资源 - 云架构中心

OPS05-03 定义变更流程 - 云架构中心

RES11-03 长稳测试 - 云架构中心

OPS08-01 使用度量指标衡量运营目标 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线