搜索_华为云

RES02-03 定期进行备份数据恢复 - 云架构中心

定期进行备份数据恢复通过定期恢复测试，可以验证备份数据的完整性与恢复处理过程是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略定期执行备份数据恢复，以验证备份的完整性。为了避免备份恢复对生产业务造成影响，可以构建一个测试环境，并使用已有的备份数据进行恢复处理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
COST05-01 分析业务趋势和优化收益 - 云架构中心

如果测试和验证变更的成本很高，优化的频率应该降低。您应该反方向考虑是否可以通过替身自动化测试和验证能力，从而进一步降低人力成本。此外，由于成本优化带来可能带来的资源冗余度的下降，故而也应该综合考虑业务的趋势。比如一个快速增长的业务组织更多地可能会偏向于提升业务的速度，而设计

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

e/Spark引擎的相关参数，主要是Job数量，Map数量，Reduce数量。通用测试标准 Hive性能上业界主要是拿TPC-DS来跟同类型的产品或者自己的老版本进行对比。标准测试仅做为性能测试的一些参考。指标观测方法通用指标的观测集群机器的CPU，内存，IO的使用情况可

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
OPS04-04 自动化工程运维任务 - 云架构中心

等工具来自动化工作负载开发和发布流程。通过使用基础架构即代码 (IaC) 方法，可以使用相同的自动化平台部署并优化基础架构。测试：许多工具可用于自动化测试过程。这些工具可以减轻质量保证团队的重大负担，并确保测试标准化且可靠。扩展：使用平台提供的功能和其他工具（例如: 资源编排服务 RFS），在负载增加或减少时自动扩展基础架构。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
RES15-03 自动化回滚 - 云架构中心

RES15-03 自动化回滚在升级或部署过程中出现异常，或检查/测试失败时，支持自动回滚，减少人工干预，避免回滚失败。风险等级高关键策略检测到异常后，可一键式回滚。回滚过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RabbitMQ性能优化 - 云架构中心
RabbitMQ性能优化 - 云架构中心

如果只有单个或少量消费者，并且消费速度很快，那么建议 QoS 设置的大一点，使得客户端保持忙碌状态。如果客户端的消息处理速度和带宽保持不变，简单的用公式RTT / 单条消息处理时间就可以估算出应该设置多大的 QoS 值。如果消费者数量较多并且消息处理速度较快，那么建议 QoS 设置的小一点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
SEC10-04 安全事件演练 - 云架构中心

SEC10-04 安全事件演练安全事件演练是一种模拟性的活动，旨在让组织成员在一个模拟的安全事件场景下进行实际操作和应对，以测试和提高其应对安全事件的能力。通过安全事件演练，组织可以评估其安全事件响应计划的有效性，发现潜在的问题并进行改进，提高团队的准备性和反应能力。风险等级

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
OPS06-07 通过可观测性指标引入自动化措施 - 云架构中心

通过可观测性指标引入自动化措施风险等级高关键策略可观测与自动化运维工具联动，实现自动化的故障检测、恢复及弹性伸缩等功能，进一步提升运维响应速度和准确性，降低人为干预带来的延误，甚至错误。父主题： OPS06 可观测性体系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
设计原则 - 云架构中心
设计原则 - 云架构中心

的服务，每个服务都负责执行特定的业务功能，可以使用不同的技术栈，由独立的团队开发，测试，部署和扩展，并通过轻量级通信机制相互交互。而在CI/CD下，同一团队以流水线的方式集成整个微服务的开发，测试和进行不同地域的部署、发布和运维。对于已经采用DevOps模式的组织，应该更进一步

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
设计原则 - 云架构中心
设计原则 - 云架构中心

康状态，通过提前预警采取维护错误，避免故障的突然发生造成严重影响。检测速度：需要根据业务综合要求，确定合适的检测速度。检测影响：故障定时检测的周期，需综合考虑对CPU占用率的影响和检测延迟对业务恢复速度的影响。检测模块要简单：故障检测系统、模块要比被检测系统、模块简单。在

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
SEC01-01建立安全管理团队 - 云架构中心

关键角色，确保从责任主体上保障工作负载的安全性。风险等级高关键策略明确职责和角色：确定团队成员的职责和角色，包括安全架构设计、安全测试、安全运营等方面的角色。每个角色应清晰定义其职责范围和任务。跨职能团队：组建一个跨职能的安全管理团队，涵盖安全运营、安全架构、安全合规等

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
SEC01-04 分隔工作负载 - 云架构中心

独立运行和管理，从而提高系统的安全性和可维护性。风险等级高关键策略一个企业特别是大型企业往往有多个不同类型（如生产环境、开发环境、测试环境）或不同组织单元（OU）下的工作负载，多个组织单元之间或多个工作负载之间要进行隔离。分隔工作负载在云环境中是非常重要的。从安全治理角度，主要基于以下几个理由：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
COST01-04 指定云资源管理策略和相应的权限管理机制 - 云架构中心

故而应该制定策略，确定您的组织应该如何管理资源。如上文所说的，可以使用账号隔离不同组织/部门的资源，甚至于在同一个组织/部门内部，开发，测试，核心业务，非核心业务，也使用不同的账号和环境。然而即使账号/环境是分散的，云资源管理策略和权限管理机制应该是集中的。企业的中心团队，如上文所提的云业务办公室、云卓越中心或

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST01 规划成本优化相应的组织机构和流程
卓越运营支柱简介 - 云架构中心

卓越运营支柱简介在华为公司，卓越运营代表着质量、效率和可持续的卓越客户体验。它帮助改进设计、开发、测试、部署、发布和运维活动，持续实现高质量的交付结果，推动了持续集成和持续交付（CI/CD）落地；同时助力打造确定性运维体系，让研发团队将更多时间用在构建让客户受益的新功能上，减少

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
OPS04-03 基础设施即代码 - 云架构中心

基础设施的能力。应用程序环境都需要许多基础设施组件，例如操作系统、数据库连接和存储。开发人员必须定期设置、更新和维护基础设施，以开发、测试和部署应用程序。手动管理基础设施既耗时又容易出错，尤其是在大规模管理应用程序时。风险等级高关键策略使用声明式工具：与命令式工具相比，声明式工具是部署和管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
OPS06-01 建立可观测性体系 - 云架构中心

通常是指基于对复杂系统外部输出的了解，能够了解其内部状态或状况的程度。系统越可观测，定位问题根本原因的过程就越快速越准确，而无需进行额外的测试或编码。风险等级高关键策略可观测体系是围绕确定性恢复命题展开的，决定了确定性恢复能力构建与 SLO 达成。可观测体系能够直接决定一些故障的恢复时长，如下图所示，MTTR

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
PERF02-01 定义性能目标 - 云架构中心

标需要能够反映出业务的需求。确定业务优先级：不同的业务需求有不同的优先级，因此需要根据业务的重要性和紧急程度确定业务的优先级，以便在性能测试和优化时重点关注。定期回顾和更新性能目标：业务需求会随着时间的推移而发生变化，因此需要定期回顾和更新性能目标，以确保其与业务目标保持一致。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
RES12-03 定期应急恢复演练 - 云架构中心

RES12-03 定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
PERF01-01 全生命周期性能管理 - 云架构中心

点插入代码，探测器）使测试和分析负载场景、资源需求、性能目标达成一致。使用监控工具来分析历史趋势，并识别支配性占比的数据流和代码实现路径。本原则强调采取措施使性能指标可测试，可以利用商用工具测试质量指标，也可以在设计时考虑相关性能指标的可测试性措施。需要测试的数据包括响应时间，处

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF01 流程与规范 > 全生命周期性能管理
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

您如何进行故障隔离？应用控制平面与数据平面隔离应用系统多位置部署采用Grid架构健康检查与自动隔离 RES011 您如何进行可靠性测试？混沌测试压力负载测试长稳测试灾难演练红蓝攻防 RES012 您如何进行应急恢复处理？组建应急恢复团队制定应急预案定期应急恢复演练出现问题后尽快恢复业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱

总条数： 78

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES02-03 定期进行备份数据恢复 - 云架构中心

COST05-01 分析业务趋势和优化收益 - 云架构中心

HIVE优化 - 云架构中心

OPS04-04 自动化工程运维任务 - 云架构中心

RES15-03 自动化回滚 - 云架构中心

RabbitMQ性能优化 - 云架构中心

SEC10-04 安全事件演练 - 云架构中心

OPS06-07 通过可观测性指标引入自动化措施 - 云架构中心

设计原则 - 云架构中心

设计原则 - 云架构中心

SEC01-01建立安全管理团队 - 云架构中心

SEC01-04 分隔工作负载 - 云架构中心

COST01-04 指定云资源管理策略和相应的权限管理机制 - 云架构中心

卓越运营支柱简介 - 云架构中心

OPS04-03 基础设施即代码 - 云架构中心

OPS06-01 建立可观测性体系 - 云架构中心

PERF02-01 定义性能目标 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

PERF01-01 全生命周期性能管理 - 云架构中心

问题和检查项 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线