搜索_华为云

RES12-02 制定应急预案 - 云架构中心

能够明确自身职责和所需要采取的措施。每个恢复操作动作必须明确无歧义，可指导操作人员。相关云服务和工具云运维中心 COC：支持应急预案管理。父主题： RES12 应急恢复处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES12-03 定期应急恢复演练 - 云架构中心

演练结束后需要对恢复过程进行回溯，并优化应急预案。相关云服务和工具云运维中心 COC：支持混沌演练，为用户提供一站式的自动化演练能力，覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端的演练流程。父主题： RES12 应急恢复处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
变更防差错 - 云架构中心
变更防差错 - 云架构中心

风险，需要为工作负载或其环境的更改做好准备，实现工作负载的可靠操作。变更操作属于运维的一部分，内容可参考卓越运营支柱部分“运维准备和变更管理”。 RES14 配置防差错 RES15 升级不中断业务父主题：韧性支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA 云数据库 TaurusDB服务支持主节点+只读节点的高可用架构，当主节点故障时，系统会自动切换到只读节点，只读节点提升为主节点，原来故障的主节点也会自动恢复为只读节点。云数据库 TaurusDB服务还支持异构容灾实例(MySQL节点)，支持在极端场景，如社

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

定期进行备份数据恢复 RES03 您如何对应用程序进行跨AZ灾难恢复？集群跨AZ部署跨AZ数据同步对接容灾仲裁，支持自动切换支持容灾管理 RES04 您如何对应用程序进行跨Region或跨云灾难恢复？定义应用系统的容灾目标RPO与RTO 部署容灾系统以满足容灾目标容灾恢复过程自动化

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式云数据库 TaurusDB的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
RES08-03 减少被依赖项故障的影响 - 云架构中心

流量过载时支持功能逐步降级。被依赖项本身的功能受损时，提供缺省处理，以便应用系统仍可继续正常运行；由于缺省处理可能与实际配置有差异，此时需要告警以便通知系统管理员解决问题。父主题： RES08 依赖减少与降级

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RabbitMQ性能优化 - 云架构中心
RabbitMQ性能优化 - 云架构中心

多线程不要共享通道，因为你很难实现线程安全。不要频繁的开启或关闭连接和通道，否则会造成更高的延迟。生产者和消费者使用独立的连接，来提高吞吐量。大量的连接和通道可能会影响管理接口的性能，造成请求超时。消息确认消费者使用确认（Acknowledgment）机制避免消息因为连接问题而丢失，客户端可以在收到消息或者处理完消息后回给服务端一个

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
RES03-01 集群跨AZ部署 - 云架构中心

Z高可用，在一个可用区故障时能自动快速切换。对于有状态ECS实例，或BMS实例，建议从应用层实现跨AZ容灾，支持跨AZ自动切换或通过容灾管理工具实现自动化容灾切换，减少灾难发生时的人工操作。对于已部署的应用系统改造为跨AZ实例的实施步骤：确定应用系统的关键组件；所谓关键组件

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES07-01 定义关键指标与阈值并监控 - 云架构中心

Apache、Java、MySQL等第三方组件，开源的Zabbix是常见选择。相关云服务和工具云监控服务 CES 应用运维管理 AOM 应用性能管理 APM 父主题： RES07 监控告警

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
COST01-03 明确团队责任，建立和维护成本意识文化 - 云架构中心

KPI指标应该随着阶段的演变而演变，以建立不断成功，不断进步的心态，而不是一次性推动成熟。在实施过程中，更多应该将错误视为学习和改进流程的机会，这将减少不成熟的团队和管理团队对成本优化的恐惧心理。指标自身也需要不断优化，一开始可以从比较保守的目标开始推动，避免IT成本迅速下降造成的业务风险。而后不断迭代预算分配、IT

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST01 规划成本优化相应的组织机构和流程
设计原则 - 云架构中心
设计原则 - 云架构中心

久度，并确保数据一致性。冗余的增加，意味着成本的增加；因此在应用高可用设计时需要综合考虑冗余对成本的影响。故障全面检测故障检测是故障管理的前提，检测全面与检测快速都很重要，通常情况下故障检测全比故障检测快重要。故障检测涉及以下方面：检测范围：识别并跟踪检测所有组件，有重大影响的故障模式需要重点检测。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
RES11-01 混沌测试 - 云架构中心
RES11-01 混沌测试 - 云架构中心

AOS随机故障注入、生产环境故障演练等能力。云运维中心 COC：支持混沌演练，为用户提供一站式的自动化演练能力，覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端的演练流程。父主题： RES11 可靠性测试

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
COST08-03 存算分离 - 云架构中心

COST08-03 存算分离风险等级中关键策略传统大数据方案计算和存储融合部署，扩容磁盘时必须扩容计算节点，在实际使用时产生浪费。存算分离是一种数据处理技术，它将数据存储和数据处理（计算）分开，使得存储和计算可以独立地进行优化和扩展，这种技术提高数据处理的效率、降低成本并满足大规模数据存储和分析的需求。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST08 进行架构优化
双Region方案 - 云架构中心
双Region方案 - 云架构中心

双Region方案采用双Region时，前端以ECS为例，建议方案如下：类别实施方案冗余 ELB、ECS、DCS、Kafka、RDS、DDS等云服务实例均高可用部署。备份 RDS、DDS数据库自动备份，在数据故障时使用最新备份数据恢复，可以满足可用性目标要求。容灾应

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据持久性 OBS通过存储介质的慢盘/坏道检测、AZ内设备和数据冗余、AZ之间数据容灾、跨区域复制等技术方案，提供针对介质、服务器、机柜、数据中心和区域的多级可靠性保障。其数据持久性高达99.9999999999%（12个9），可用性高达99.995%，远高于传统架构。详见“OBS的持久性和可用性如何

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
Serverless性能优化 - 云架构中心

可能造成执行排队时延升高，甚至出现报错。建议最大实例数和业务实际最大并发数保持一致。预留实例数预留实例是将函数实例的创建和释放交由用户管理，当您为某一函数创建了预留实例，函数工作流收到此函数的调用请求时，会优先将请求转发给您的预留实例，当请求的峰值超过预留实例处理能力时，剩余

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

Flink性能优化概述 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pi

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA Kafka实例通过副本冗余方式实现实例容灾，当检测到leader副本故障后，快速完成副本选主，保障Kafka实例持续提供服务。 RabbitMQ集群提供镜像队列，通过镜像在其他节点同步数据。单节点宕机时，仍可通过唯一的访问地址对外提供服务。 RocketMQ

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库

总条数： 289

上一页
1
...
10
11
12
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES12-02 制定应急预案 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

变更防差错 - 云架构中心

可靠性功能 - 云架构中心

问题和检查项 - 云架构中心

常见故障模式 - 云架构中心

RES08-03 减少被依赖项故障的影响 - 云架构中心

RabbitMQ性能优化 - 云架构中心

RES03-01 集群跨AZ部署 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

COST01-03 明确团队责任，建立和维护成本意识文化 - 云架构中心

设计原则 - 云架构中心

RES11-01 混沌测试 - 云架构中心

COST08-03 存算分离 - 云架构中心

双Region方案 - 云架构中心

可靠性功能 - 云架构中心

Serverless性能优化 - 云架构中心

Flink性能优化 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线