搜索_华为云

RES07-02 日志统计监控 - 云架构中心

RES07-02 日志统计监控应用系统需要收集日志，在必要时对日志进行统计分析，设置告警规则触发告警，统计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
PERF04-05 应用性能数据采集 - 云架构中心

PERF04-05 应用性能数据采集风险等级中关键策略应用程序的性能数据（吞吐量、延迟和完成时间），通常需要通过代码采集，例如嵌入代码片段或将工具集成到应用程序代码中。通过应用的性能数据，可以识别性能瓶颈、评估系统行为、识别可用性风险、规划容量等指标。常用应用性能监控策略有：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
PERF06-02 性能劣化自动定界定位 - 云架构中心

PERF06-02 性能劣化自动定界定位风险等级中关键策略通过建立的分层性能模型，判断系统是否会出现性能劣化的情况。当出现劣化事件时，需要通过自动化手段快速定位定界发现根因。可以通过应用模型建设三维的拓扑，把架构-空间-时间数据关联起来。这里面的关键是架构模型的建立及分层

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标通过定期的容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
OPS07-03 支持事件管理 - 云架构中心

OPS07-03 支持事件管理风险等级高关键策略事件(incidents)是需要干预的事情。当发生事故(incidents)时，通过流程来处理。如何与团队沟通活动的状态？谁负责响应处置？使用哪些工具来缓解该事件？这些都是流程中需要回答的问题，并需要获得可靠的响应过程。流程

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
RES04-03 容灾恢复过程自动化 - 云架构中心

RES04-03 容灾恢复过程自动化由于容灾恢复场景涉及容灾站点的业务恢复、数据库的主备切换、业务到容灾站点的流量切换等，恢复过程比较复杂，因此需要提供容灾管理功能，实现容灾状态及RPO监控，以及灾难场景下的一键式自动切换，减少人工干预。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
OPS03-05 进行混沌测试和演练 - 云架构中心

OPS03-05 进行混沌测试和演练混沌工程（Chaos Engineering）是通过故障注入，验证故障快速恢复能力及系统可靠性的实践活动。风险等级高关键策略通过混沌工程的方法模拟可能出现的故障，进而综合验证系统在不同故障场景下的容错能力、监控能力、应急响应能力、定界定位、快速恢复等确定性恢复能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

COST04-01 建立规范，持续提升成本分配比例风险等级中关键策略成本是否准确有效的分配，是后续进行成本监控和优化的基础。客户应关注并提升成本分配比例，奠定成本治理的基础。标签作为一种常见的成本分配方式，可以灵活匹配组织内多种分配场景（比如产品、应用、责任人），但在实

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST04 持续进行成本治理
OPS07-01 创建可操作的告警 - 云架构中心

OPS07-01 创建可操作的告警风险等级高关键策略收到告警时，一般需要做出响应，消除无须响应的告警。比如磁盘IO 量瞬间飙升，CPU 使用率瞬间飙高，这类告警无需做出响应，对业务而言，意义就不大了。遵循可操作性原则能避免很多误报。并且要定期统计和分析告警频率，识别高

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
设计原则 - 云架构中心
设计原则 - 云架构中心

设计原则建立持续改进的团队文化和标准化运维体系在卓越运营中，团队文化建设至关重要。运营是一门不断改进的艺术。只有不断从已有事故中学习经验，持续学习和改进，才能最终达到卓越运营。故而，团队应该培养持续学习和改进的文化，此外，在事故发生时，应该以对事不对人的态度，思考系统的改进，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
COST03-01 制定成本分摊原则 - 云架构中心

COST03-01 制定成本分摊原则风险等级高关键策略成本分配支撑企业将成本分配到各业务团队中，使得各业务团队的成本清晰可见。这也是上文中明确的团队责任的基础。根据清晰的成本，业务部门可准确定价，并平衡成本、稳定性和性能，经济高效的提供领先方案。企业管理者基于数据决策各

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST03 对成本进行分配
COST01-02 规划IT治理体系，提高管理效率 - 云架构中心

COST01-02 规划IT治理体系，提高管理效率风险等级高关键策略实施与您的组织对应的IT治理结构。这有助于在整个组织内分摊和管理成本。随着经营范围和规模的不断扩张，不断建立子公司、分公司，大部门也逐步拆分成多个小部门，组织结构的层级也就越来越多。企业的IT治理架构也会

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST01 规划成本优化相应的组织机构和流程
RES11-01 混沌测试 - 云架构中心
RES11-01 混沌测试 - 云架构中心

RES11-01 混沌测试混沌工程（Chaos Engineering）是通过故障注入的方式，触发或模拟实际故障，验证系统的稳定性和容错保护能力。风险等级高关键策略在真实环境中测试。作为CI/CD管道的一部分例行执行。主动注入故障，以便在问题发生前提前发现并解决问题。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES12-02 制定应急预案 - 云架构中心

RES12-02 制定应急预案针对常见问题现象，提供标准化的应急恢复指导，以便在出现问题后，可以有序的完成恢复操作，避免操作失误。风险等级高关键策略需要覆盖常用典型场景。应急恢复需要有标准的操作流程和动作，确保在事件发生时，相关干系人都能够明确自身职责和所需要采取的措施。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
COST02-02 精细化预算管理和跟踪 - 云架构中心

COST02-02 精细化预算管理和跟踪风险等级高关键策略针对企业不同项目/业务/应用，应该建立预算管理机制，精细化管理每个项目/业务/应用全生命周期的云开销。企业的项目/业务是随时间变化而变化的，一般而言，新兴业务/项目常有更多云资源扩容的需求，而稳定的业务/项目则可

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST02 实施预算规划管理机制
卓越架构技术框架简介 - 云架构中心

卓越架构技术框架简介卓越架构技术框架（Well-Architected Framework）聚焦客户业务上云后的关键问题的设计指导和最佳实践。以华为公司和业界最佳实践为基础，以韧性、安全性、性能效率、成本优化与卓越运营五个架构关注点为支柱，打造领先的卓越架构技术框架，支撑客户

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践
单Region方案 - 云架构中心
单Region方案 - 云架构中心

单Region方案采用单Region时，前端以CCE为例，建议方案如下：类别实施方案冗余 ELB、CCE、DCS、Kafka、RDS、DDS等云服务实例均高可用部署。备份 RDS、DDS数据库自动备份，在数据故障时使用最新备份数据恢复，可以满足可用性目标要求。容灾应

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
SEC10-03 自动化响应安全事件 - 云架构中心

SEC10-03 自动化响应安全事件自动化的响应工作流是安全自动化的核心组成部分，旨在减少安全事件的响应时间，并提高处理效率。风险等级高关键策略定义响应触发条件：基于威胁情报、异常行为检测和实时监测的结果，确定哪些情况会触发自动化响应。制定响应策略：为每种类型的威胁或

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
OPS05-02 进行变更风控 - 云架构中心

OPS05-02 进行变更风控风险等级高关键策略根据不同变更场景构建风险控制能力，通过风险数字化度量分析和评估风险影响程度，并采取风险控制措施削减或规避风险，保障变更成功。变更风险指现网各要素增、删、改及状态改变（如版本迭代、配置改变、节点扩缩容等）时引发的业务中断风险及变更失败可能导致的业务受损风险。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
RES12-03 定期应急恢复演练 - 云架构中心

RES12-03 定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理

总条数： 330

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES07-02 日志统计监控 - 云架构中心

PERF04-05 应用性能数据采集 - 云架构中心

PERF06-02 性能劣化自动定界定位 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

OPS07-03 支持事件管理 - 云架构中心

RES04-03 容灾恢复过程自动化 - 云架构中心

OPS03-05 进行混沌测试和演练 - 云架构中心

COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

OPS07-01 创建可操作的告警 - 云架构中心

设计原则 - 云架构中心

COST03-01 制定成本分摊原则 - 云架构中心

COST01-02 规划IT治理体系，提高管理效率 - 云架构中心

RES11-01 混沌测试 - 云架构中心

RES12-02 制定应急预案 - 云架构中心

COST02-02 精细化预算管理和跟踪 - 云架构中心

卓越架构技术框架简介 - 云架构中心

单Region方案 - 云架构中心

SEC10-03 自动化响应安全事件 - 云架构中心

OPS05-02 进行变更风控 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线