搜索_华为云

可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据备份和恢复使用CBR云备份服务可对BMS的所有云硬盘（系统盘和数据盘）进行备份，支持基于多云硬盘一致性快照技术的备份服务，并支持利用备份数据恢复裸金属服务器数据，最大限度保障用户数据的安全性和正确性，确保业务安全。详见“备份裸金属服务器”。集群HA 配合共享云

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
PERF06-03 自动告警 - 云架构中心

PERF06-03 自动告警风险等级中关键策略通过在云监控平台配置对应的告警策略，可以及时了解资源风险，以便做出对应调整和策略。相关云服务和工具：优化顾问 OA 云监控服务 CES 父主题：性能看护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
PERF04-06 建立性能可观测性体系 - 云架构中心

建立性能可观测性体系风险等级中关键策略可观测性体系是指在云原生架构中通过使用各种工具和技术来实现对应用程序和基础设施的监控告警、日志、故障排除等功能的一套完整的解决方案。性能可观测体系在此基础上突出了性能指标，通过收集和分析性能数据，可以识别系统瓶颈、优化资源分配等，找到性能优化方向。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 建立性能可观测性体系
跨云容灾方案 - 云架构中心
跨云容灾方案 - 云架构中心

跨云容灾方案当重要应用系统已经在IDC或其他云上部署，并需要容灾到华为云，以提供高可用的容灾方案。假定应用系统在IDC或其他云上可以达到99.9%的可用性，则在容灾到华为云后，能提供99.99%的可用性。跨云应用典型架构为前端无状态应用层+后端数据库，其中前端无状态应用可采用虚拟

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

CCE集群的CPU /内存/磁盘容量使用率过高检测：通过AOM监控CCE集群的CPU/内存/磁盘容量使用率。恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换针对有状态的主备类型业务，在跨AZ部署并支持自动切换时，需要对接容灾仲裁，以避免出现双主或双备，从而在AZ间链路中断的情况下，业务能自动切换到一个AZ提供服务而不受影响；对于集群类业务不涉及。风险等级高关键策略面向有状态主备类

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
应用性能管理(APM) - 云架构中心

Management，简称APM）帮助运维人员快速发现应用的性能瓶颈，以及故障根源的快速定位，为用户体验保驾护航。您无需修改代码，只需为应用安装一个APM Agent，就能够对该应用进行全方位监控，帮助您快速定位出错接口和慢接口、重现调用参数、发现系统瓶颈，从而大幅提升线上问题诊断的效率。目前支持JAVA、Python、Node

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

接地址后，即可快速恢复应用的业务访问。数据复制服务提供的实时灾备功能，可实现主实例和跨区域的灾备实例之间的单主灾备（详见“MySQL到MySQL单主灾备”）或双主灾备（详见“MySQL到MySQL双主灾备”）。监控告警配合CES服务，支持对RDS的CPU、内存、磁盘、网络等进行监控和告警。详见“支持的监控指标”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

例节点、实例主题、实例分区、实例分区的消费组、实例队列的消费组、实例的消费组等进行监控和告警。详见“支持的监控指标”。 RabbitMQ：配合CES服务，支持对RabbitMQ实例、实例节点、实例队列进行监控和告警等进行监控和告警。详见“支持的监控指标”。 RocketMQ：配合

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

lave）均无法连接时，可将异地灾备实例切换为主实例，在应用端修改数据库链接地址后，即可快速恢复应用的业务访问。数据复制服务提供的实时灾备功能，可实现主实例和跨区域的灾备实例之间的单主灾备（详见“GaussDB(for MySQL)到GaussDB(for MySQL)单主灾备”

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > GaussDB(for MySQL)云数据库
OPS07-04 支持故障恢复流程 - 云架构中心

现、故障定位、故障恢复、故障复盘及持续改进（含故障演练），基于故障模式库，面向全流程、构建恢复能力、保证平均恢复时长（MTTR）的长效收敛，实现故障的快速恢复。设计建议父主题： OPS07 进行故障分析和管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如RDS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。当RDS实例由于过载导致网络限制时，可参考“RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高”的处理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
SEC10-02 制定事件响应计划 - 云架构中心

/S2/S3/S4/S5。实施持续的监控，包括云环境的日志、网络流量和异常行为。当检测到潜在事件时，进行初步分析以确定事件的性质和严重性。实施快速安全响应动作，隔离受影响的系统或账户、断开网络连接、停止服务、清除恶意文件、修复漏洞、替换受损系统并加固系统，确认所有威胁已经被完全清除，避免再次发生。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
Kafka性能优化 - 云架构中心
Kafka性能优化 - 云架构中心

业务数据不均衡原因业务中部分Topic的流量远大于其他Topic，会导致节点间的数据不均衡。生产者发送消息时指定了分区，未指定的分区没有消息，会导致分区间的数据不均衡。生产者发送消息时指定了消息Key，按照对应的Key发送消息至对应的分区，会导致分区间的数据不均衡。系统重新实现了分

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
RTO与RPO - 云架构中心
RTO与RPO - 云架构中心

灾难场景通常采用RTO和RPO目标定义：恢复时间目标RTO：指灾难发生后应用不可用的最长时间。RTO决定了应用容灾整体架构，是采用数据备份，还是冷备、温备、热备。恢复点目标RPO：指灾难发生后应用数据丢失的最大时间。RPO决定了数据备份频率或复制方式，是在线备份还是离线备份，是同步复制还是异步复制。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
RES01-02 应用组件多位置部署 - 云架构中心

n故障而导致所有业务中断。在多AZ部署能满足需求的情况下，应优先使用多AZ部署。大多数工作负载的可用性目标都可通过在单个Region内多 AZ 部署来实现，只有工作负载具有极高的可用性要求或者其他业务目标时，才考虑多Region架构。父主题： RES01 冗余

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES10-01 应用控制平面与数据平面隔离 - 云架构中心

应用控制平面与数据平面隔离通常应用的数据平面处理业务，比较重要，可用性要求比较高，而控制平面不直接处理业务，因此其故障时不应该影响业务系统。风险等级高关键策略应用控制平面与数据平面隔离，避免控制系统故障影响业务。数据平面所在业务系统的故障恢复可不依赖控制平面，避免由于控制平面故障而导致业务系统无法恢复。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
单Region方案 - 云架构中心
单Region方案 - 云架构中心

数据层：每个可用区各部署一套RDS数据库，通过DRS数据复制服务实现跨AZ的双向数据库复制与容灾切换；并支持定期自动数据备份，在数据丢失时能快速恢复。OBS对象存储跨可用区高可用部署，单个AZ故障对业务没有影响。为了保证数据的可靠性，RDS数据库的数据定期自动备份。父主题：电商类应用典型部署架构（99

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
OPS05-02 进行变更风控 - 云架构中心

）时引发的业务中断风险及变更失败可能导致的业务受损风险。设计建议变更风控衡量指标：变更风控衡量指标为变更导致事件密度和变更引入重大事件数。变更导致事件密度定义：每月变更导致对客户造成影响的事件数与总变更数的比值。计算公式：变更导致事件密度=变更导致对客户造成影响的事件数/总变更数。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
双Region方案 - 云架构中心
双Region方案 - 云架构中心

RDS、DDS等实例负载状态及资源故障切换等的监控，在负载超过阈值或状态异常时告警。弹性扩缩容支持自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可通过AS监控负载随时添加和移除ECS实例来扩展应用系统的服务能力；针对RDS for MySQL，可根

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）

总条数： 332

上一页
1
...
11
12
13
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

可靠性功能 - 云架构中心

PERF06-03 自动告警 - 云架构中心

PERF04-06 建立性能可观测性体系 - 云架构中心

跨云容灾方案 - 云架构中心

常见故障模式 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

应用性能管理(APM) - 云架构中心

可靠性功能 - 云架构中心

可靠性功能 - 云架构中心

可靠性功能 - 云架构中心

OPS07-04 支持故障恢复流程 - 云架构中心

常见故障模式 - 云架构中心

SEC10-02 制定事件响应计划 - 云架构中心

Kafka性能优化 - 云架构中心

RTO与RPO - 云架构中心

RES01-02 应用组件多位置部署 - 云架构中心

RES10-01 应用控制平面与数据平面隔离 - 云架构中心

单Region方案 - 云架构中心

OPS05-02 进行变更风控 - 云架构中心

双Region方案 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线