搜索_华为云

OPS07-04 支持故障恢复流程 - 云架构中心

OPS07-04 支持故障恢复流程风险等级高关键策略当现网发生故障时，既要快速恢复业务，又要降低影响，首先需要围绕故障全生命周期采取一系列控制流程，包含故障预防、故障发现、故障定位、故障恢复、故障复盘及持续改进（含故障演练），基于故障模式库，面向全流程、构建恢复能力、保证

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
RES08-01 减少强依赖项 - 云架构中心

RES08-01 减少强依赖项系统内组件之间强依赖时，一个组件故障会对其他组件造成直接影响，影响系统可用性。风险等级中关键策略可以通过以下技术将强依赖项转换为非强依赖项：提高关键依赖项的冗余级别，降低该关键组件不可用的可能性。与依赖项的通信采用异步消息并支持超时重试

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES11-02 压力负载测试 - 云架构中心

RES11-02 压力负载测试通过施加超出系统容量的业务压力，验证云服务的过载保护、业务隔离和优雅降级等能力。为全面验证系统整体的容量规划和业务依赖，云服务应用通常采用全链路压测进行测试。风险等级高关键策略模拟大量接口消息进行压力测试。模拟各种业务场景进行压力测试。持续自动测试。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES13-03 过载检测与流量控制 - 云架构中心

RES13-03 过载检测与流量控制当应用系统发生过载时，可能会导致系统疲于处理请求而无法有效提供服务，因此需要进行过载检测并进行流量控制。风险等级高关键策略过载控制(也称流控)指系统处于过载时，通过限流、降级、熔断、弹性伸缩等手段，使系统保证部分或者全部额定容量业务成

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

Flink性能优化概述 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pi

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
OPS05-03 定义变更流程 - 云架构中心

OPS05-03 定义变更流程风险等级高关键策略在建立标准的变更管理流程前，清晰明白变更各个流程的定义：变更发起：在变更发起前，需明确变更内容与变更原因等信息。信息的明确可减轻变更评估人的工作量，同时明确变更的意义。变更信息包括：基本信息：标题、时间、变更人、原因等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
RES03-01 集群跨AZ部署 - 云架构中心

RES03-01 集群跨AZ部署应用内所有组件均采用跨AZ容灾部署，以避免单AZ故障时业务中断。风险等级高关键策略云服务实例具备跨AZ高可用实例时，优先使用云服务实例自身的跨AZ高可用实例。云服务实例只支持发放单AZ实例，不支持跨AZ高可用实例时，需要借助其他云服务或应用层实现跨AZ容灾；以ECS为例：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES12-03 定期应急恢复演练 - 云架构中心

RES12-03 定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES14-01 变更防呆检查 - 云架构中心

RES14-01 变更防呆检查防呆是一种预防矫正的行为约束手段，运用防止错误发生的限制方法，让操作者不需要花费注意力、也不需要经验与专业知识，凭借直觉即可准确无误地完成的操作。风险等级高关键策略通过以下约束和检查，可减少配置差错：角色约束：通过权限控制设计预防对不同角

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
RES14-03 变更前数据备份 - 云架构中心

RES14-03 变更前数据备份通过配置数据事前备份与恢复设计，确保在出现配置错误时能够快速恢复到正确的配置数据状态。风险等级高关键策略进行全量数据备份，以防变更过程中数据被破坏，影响业务。异常回滚时，可使用备份数据进行恢复。父主题： RES14 配置防差错

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
RES01-01 应用组件高可用部署 - 云架构中心

RES01-01 应用组件高可用部署应用系统内的所有组件均需要高可用部署，避免单点故障。风险等级高关键策略应用系统内各组件需要根据其具体能力，采用不同的高可用部署方案：使用原生高可用实例：当云服务既支持单节点资源，又支持主备或集群资源时，应用的关键节点应使用主备或集群

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES08-02 依赖松耦合 - 云架构中心

RES08-02 依赖松耦合系统内组件之间直接访问时，会产生紧耦合关系一个组件的状态变化会对其他组件产生直接影响，从而会导致所有组件的可用性均下降。而采用松耦合架构时，各个组件之间的依赖关系非常弱，它们可以独立地进行修改和扩展，而不影响其他组件；系统更加灵活，易于维护和升级，并且稳定性和可靠性也更强。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES11-05 红蓝攻防 - 云架构中心
RES11-05 红蓝攻防 - 云架构中心

RES11-05 红蓝攻防通过红蓝攻防，可以模拟各种复杂的攻击场景，帮助全面评估应用韧性，及时发现并解决潜在风险。风险等级高关键策略蓝军从第三方角度发掘各类脆弱点，并向业务所依赖的各种软硬件注入故障，不断验证业务系统的可靠性；而红军则需要按照预先定义的故障响应和应急流程进行处置。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
SEC10-04 安全事件演练 - 云架构中心

SEC10-04 安全事件演练安全事件演练是一种模拟性的活动，旨在让组织成员在一个模拟的安全事件场景下进行实际操作和应对，以测试和提高其应对安全事件的能力。通过安全事件演练，组织可以评估其安全事件响应计划的有效性，发现潜在的问题并进行改进，提高团队的准备性和反应能力。风险等级

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
选择合适的应用中间件云服务资源 - 云架构中心

选择合适的应用中间件云服务资源华为云提供Kafka、RocketMQ、RabbitMQ三种不同版分布式消息服务，您可根据业务需求和不同版本优势来选择合适的消息队列。 PERF03-06 选择合适的消息队列 PERF03-07 选择合适的Kafka PERF03-08 选择合适的RocketMQ

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模
COST05-03 定期回顾和审核 - 云架构中心

COST05-03 定期回顾和审核风险等级高关键策略为了让云上应用始终最具成本效益，推荐您定期对其进行回顾和审核，以了解是否有机会实施新的优化措施。回顾和审核可以基于成本分配的原则，在应用级别执行，持续审核组织为每个云上应用付出的总体成本。通过综合考虑云资源成本，研发成本，运营管理成本（如托管服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
OPS06-06 实施分布式跟踪 - 云架构中心

OPS06-06 实施分布式跟踪 Trace是一系列因果相关的分布式事件的表示，这些事件编码了流经分布式系统的端到端请求流。风险等级高关键策略当系统出现问题时，需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪，可以快速定位问题并进行有效的故障排除。设计建议

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
COST05-01 分析业务趋势和优化收益 - 云架构中心

COST05-01 分析业务趋势和优化收益风险等级高关键策略云成本是一个综合工程，也是一个定期审核、回顾和执行的流程，除了考虑优化带来的收益以外，还需要考虑相关成本，例如，因为优化带来的人员和时间成本。为了降低整体成本，优化的工作量必须与潜在的节省额成比例。优化可以从应用占成本的比例考虑。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
OPS05-02 进行变更风控 - 云架构中心

OPS05-02 进行变更风控风险等级高关键策略根据不同变更场景构建风险控制能力，通过风险数字化度量分析和评估风险影响程度，并采取风险控制措施削减或规避风险，保障变更成功。变更风险指现网各要素增、删、改及状态改变（如版本迭代、配置改变、节点扩缩容等）时引发的业务中断风险及变更失败可能导致的业务受损风险。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
RES06-02 面向所有故障进行检测 - 云架构中心

RES06-02 面向所有故障进行检测针对所有故障场景，都需要能自动检测，以便及时发现和恢复故障。风险等级高关键策略所有故障都必须有检测。支持按不同维度进行故障检测，如Region、AZ、服务、方法、实例或容器ID等，检测维度与故障恢复方式对齐。检测到故障后需及时告警或自动恢复。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测

总条数： 381

上一页
1
...
13
14
15
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS07-04 支持故障恢复流程 - 云架构中心

RES08-01 减少强依赖项 - 云架构中心

RES11-02 压力负载测试 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

Flink性能优化 - 云架构中心

OPS05-03 定义变更流程 - 云架构中心

RES03-01 集群跨AZ部署 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

RES14-01 变更防呆检查 - 云架构中心

RES14-03 变更前数据备份 - 云架构中心

RES01-01 应用组件高可用部署 - 云架构中心

RES08-02 依赖松耦合 - 云架构中心

RES11-05 红蓝攻防 - 云架构中心

SEC10-04 安全事件演练 - 云架构中心

选择合适的应用中间件云服务资源 - 云架构中心

COST05-03 定期回顾和审核 - 云架构中心

OPS06-06 实施分布式跟踪 - 云架构中心

COST05-01 分析业务趋势和优化收益 - 云架构中心

OPS05-02 进行变更风控 - 云架构中心

RES06-02 面向所有故障进行检测 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线