搜索_华为云

RES04-03 容灾恢复过程自动化 - 云架构中心

RES04-03 容灾恢复过程自动化由于容灾恢复场景涉及容灾站点的业务恢复、数据库的主备切换、业务到容灾站点的流量切换等，恢复过程比较复杂，因此需要提供容灾管理功能，实现容灾状态及RPO监控，以及灾难场景下的一键式自动切换，减少人工干预。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
OPS07-04 支持故障恢复流程 - 云架构中心

复盘及持续改进（含故障演练），基于故障模式库，面向全流程、构建恢复能力、保证平均恢复时长（MTTR）的长效收敛，实现故障的快速恢复。设计建议父主题： OPS07 进行故障分析和管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

定期进行容灾演练，以检查恢复能否满足容灾目标通过定期的容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程计时，以确定应用系统的RPO与RTO目标能否满足。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
性能测试 - 云架构中心
性能测试 - 云架构中心

态下对系统的各项性能指标进行测试的活动，它关注运行系统在特定负载下的性能，可帮助你评估系统负载在各种方案中的功能，涉及系统在负载下的响应时间、吞吐量、资源利用率和稳定性，以帮助确保系统性能满足基线要求，有助于提早发现性能问题，防止随着系统运行可能出现的性能裂化小于基线的情况。以下内容将带领大家了解性能测试。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析
RES07-02 日志统计监控 - 云架构中心

设置告警规则触发告警，统计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。相关云服务和工具云日志服务 LTS 父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 - 云架构中心

基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析某公司核心业务专注于IT信息传播、技术交流、教育培训和专业技术人才服务。拥有超过3200万注册会员、超过1000家企业客户及合作伙伴。客户痛点：端侧采集工具不统一，不支持自定义域名上报，问题定位复杂 Web、IOS

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
RES03 跨AZ容灾 - 云架构中心
RES03 跨AZ容灾 - 云架构中心

本来完成容灾架构部署。应用系统可设计为使用分布在多个可用区中的资源池，并利用云服务实例本身具备或应用自身支持的跨AZ数据复制与切换能力，在多个AZ之间复制数据、负载均衡和跨AZ故障切换，从而使应用系统具备应对可用区故障的能力。 RES03-01 集群跨AZ部署 RES03-02 跨AZ数据同步

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
RES02 备份 - 云架构中心
RES02 备份 - 云架构中心

替备份。备份恢复时的RPO指标（即数据丢失量），与最近一个备份时间点相关；不同类型的数据，允许丢失数据量可以不同，即RPO不同；为了保证数据备份的RPO目标，需要采用定期自动备份，而不要依赖人工进行手工备份。 RES02-01 识别和备份应用中所有需要备份的关键数据 RES02-02

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
PERF05-01 设计优化 - 云架构中心

根据某项功能的使用频率来选择。常见的快速通道如，页面快速导航键、DB的索引等。重要事情优先把资源优先用于或者集中在重要的任务处理上，确保重要任务的完成；如果不能在可用的时间内完成所有事情，被忽略的是最不重要的任务。主要用于处理瞬时突发负载导致超出系统处理的容量的情况，一般给重

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 设计优化
AS弹性伸缩 - 云架构中心
AS弹性伸缩 - 云架构中心

Scaling，以下简称AS）是根据用户的业务需求，通过设置伸缩规则来自动增加/缩减业务资源。当业务需求增长时，AS自动增加弹性云服务器（ECS）实例或带宽资源，以保证业务能力；当业务需求下降时，AS自动缩减弹性云服务器（ECS）实例或带宽资源，以节约成本。AS支持自动调整弹性云服务器和带宽资源。可靠性功能

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
RES09 故障重试 - 云架构中心
RES09 故障重试 - 云架构中心

RES09 故障重试当应用系统部署在云中，虽然云具有一定的高可用和故障自动恢复能力，但对外仍会导致短时间的故障，需要应用系统能针对这种短时间故障进行适配处理，主要是采用重试机制。云中故障需要重试的典型场景有：实例主备切换时可能会导致连接中断，如DCS、RDS实例由于某些原因

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
RES02-03 定期进行备份数据恢复 - 云架构中心

RES02-03 定期进行备份数据恢复通过定期恢复测试，可以验证备份数据的完整性与恢复处理过程是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略定期执行备份数据恢复，以验证备份的完整性。为了避免备份恢复对生产业务造成影响，可以构建一个测试环境，并使用已有的备份数据进行恢复处理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

负载均衡分发时需检查后端节点的负载状态，并根据各节点的负载进行业务分发。在后端节点故障的情况下，需要自动将业务分发给其他健康节点处理，以避免业务失败。相关云服务和工具弹性负载均衡 ELB：支持业务负载均衡处理，还支持后端服务器健康状态检测，自动隔离异常状态的ECS。父主题： RES13

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

ELB采用集群化部署，支持多可用区的同城多活容灾，无缝实时切换。后端服务器健康检查 ELB弹性负载均衡支持定期向后端服务器发送请求以测试其运行状态。当判断后端服务器健康检查异常后，就不会将流量分发到异常后端服务器，而是分发到健康检查正常的后端服务器，从而提高了业务的可靠性。当异常的后端服务器恢复正

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
RES03-04 支持容灾管理 - 云架构中心

RES03-04 支持容灾管理提供容灾管理功能，实现容灾状态及RPO监控，及异常场景下的业务切换。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。支持应用级数据校验，比较AZ间数据同步差异，监控及PO指标。典型确定性故障场景下自动容灾或切换，无需人工接入，业务不受影响，满足RPO/RTO指标。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
PERF03-06 选择合适的消息队列 - 云架构中心

PERF03-06 选择合适的消息队列风险等级中关键策略三种不同版分布式消息服务的适用场景如下： Kafka：兼容开源Kafka，适用构建实时数据管道、流式数据处理、第三方解耦、流量削峰去谷等场景，有大规模、高可靠、高并发访问、可扩展且完全托管的特点。 RocketMQ：兼

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的应用中间件云服务资源
双Region方案 - 云架构中心
双Region方案 - 云架构中心

RDS、DDS等实例负载状态及资源故障切换等的监控，在负载超过阈值或状态异常时告警。弹性扩缩容支持自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可通过AS监控负载随时添加和移除ECS实例来扩展应用系统的服务能力；针对RDS for MySQL，可根

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
RES10-03 采用Grid架构 - 云架构中心

rid，使用全映射会带来对映射表的严重读写依赖，读写一致性要求考虑，通常需要引入meta data service。基于前缀和范围mapping：基于前缀和范围的映射，将键范围映射到Grid，并在提供灵活性的同时，弥补了Full-Mapping的不足。 Mapping代替：强制

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

无法采集云服务指标信息：客户自建运维体系无法采集到云服务等场景的指标信息，不能满足大屏展示需要告警通知能力不足：自建运维平台告警通知能力不能完全满足多场景通知的需要，且没有告警降噪能力解决方案：业务价值：降低了运维成本与难度：降低了运维多套系统的难度，减少了客户运维起步的资源投入，降低了运维成本运营分

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
OPS05-03 定义变更流程 - 云架构中心

OPS05-03 定义变更流程风险等级高关键策略在建立标准的变更管理流程前，清晰明白变更各个流程的定义：变更发起：在变更发起前，需明确变更内容与变更原因等信息。信息的明确可减轻变更评估人的工作量，同时明确变更的意义。变更信息包括：基本信息：标题、时间、变更人、原因等。变

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理

总条数： 292

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES04-03 容灾恢复过程自动化 - 云架构中心

OPS07-04 支持故障恢复流程 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

性能测试 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 - 云架构中心

RES03 跨AZ容灾 - 云架构中心

RES02 备份 - 云架构中心

PERF05-01 设计优化 - 云架构中心

AS弹性伸缩 - 云架构中心

RES09 故障重试 - 云架构中心

RES02-03 定期进行备份数据恢复 - 云架构中心

RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

可靠性功能 - 云架构中心

RES03-04 支持容灾管理 - 云架构中心

PERF03-06 选择合适的消息队列 - 云架构中心

双Region方案 - 云架构中心

RES10-03 采用Grid架构 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

OPS05-03 定义变更流程 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线