搜索_华为云

RES12-04 出现问题后尽快恢复业务 - 云架构中心

态；维护团队需要有专人观测，并在发现故障发生时，需要及时响应。告警：应用系统在检测到故障后需要及时告警，并能通过短消息、邮件等方式发送给所有相关人员，确保使相关人第一时间得知故障信息，以便快速组织应急响应。预测：维护团队需要根据系统运行现状，通过数据分析、机器学习等方式，预测系统的风险情况，提前进行预防和处理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
SEC02-02 安全的登录机制 - 云架构中心

除了账号，确保IAM管理员（有管理员权限的IAM用户）也开启MFA机制登录，避免登录凭证泄露带来的风险。配置IAM的登录验证策略，如会话超时策略、账号锁定策略、账号停用策略、最近登录提示等。配置IAM的网络访问控制策略。限制用户只能从特定 IP 地址区间、网段及 VPC Endpoint

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC02 身份认证
SEC10-05建立复盘机制 - 云架构中心

实施改进措施：将制定的改进措施付诸实施，并监控其执行情况。确保所有相关人员都了解并遵守这些改进措施。定期检视和更新：定期检视复盘结果和改进措施的执行情况，并根据需要进行更新和调整。持续改进是一个持久的过程。文档和分享：将复盘的结果和改进措施进行文档化，并与团队内部分享。这有助于确保所有人都能从中学习，并避免类似的错误再次发生。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
RES08-02 依赖松耦合 - 云架构中心

RES08-02 依赖松耦合系统内组件之间直接访问时，会产生紧耦合关系一个组件的状态变化会对其他组件产生直接影响，从而会导致所有组件的可用性均下降。而采用松耦合架构时，各个组件之间的依赖关系非常弱，它们可以独立地进行修改和扩展，而不影响其他组件；系统更加灵活，易于维护和升级，并且稳定性和可靠性也更强。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
SEC10-02 制定事件响应计划 - 云架构中心

实施快速安全响应动作，隔离受影响的系统或账户、断开网络连接、停止服务、清除恶意文件、修复漏洞、替换受损系统并加固系统，确认所有威胁已经被完全清除，避免再次发生。制定恢复策略，逐步恢复受影响服务，确保数据和系统一致性，进行测试确保所有系统恢复正常运作。进行事件后分析，总结事件的起因、响应过程和教训。更新事件响应计划，根据经验教训进行改进。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
OPS01-01 建立持续学习和改进的文化 - 云架构中心

高关键策略由于系统的独特性和复杂性，没有放之四海皆准的方案，为了达到卓越运营，需要不断改进这些最佳实践，并建立自己的最佳实践。所以，在所有最佳实践的第一条，就是在您的团队中培养持续学习和改进的文化。而持续学习和改进需要鼓励团队沟通和共享，例如，在您公司/组织中总结的最佳实践

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
可用性需求 - 云架构中心
可用性需求 - 云架构中心

可用性需求根据“常见IT系统SLO示意”中的表格可以得知，不同的IT系统，SLO目标是存在差异的，不是所有的应用系统都需要达到最高可用性要求。当系统可用性目标要求升高时，所需的成本也通常会增加，因此在可用性目标制定时，需要对韧性与成本进行权衡，确定真正的可用性需求。在系统的

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
PERF04-04 资源性能数据收集 - 云架构中心

情况。通过收集资源性能数据，可以深入了解工作负载的运行状况和行为。指标作用：帮助你了解资源的运行状况和性能，在云监控平台上配置对应的告警策略和配置指标看板。通过跟踪分析网络路径上的流量来优化网络性能。相关云服务和工具云监控服务 CES 父主题：性能数据采集

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
故障全面检测 - 云架构中心
故障全面检测 - 云架构中心

高可用性系统必须具有完善的故障检测能力，以确保能够快速发现那些可能导致故障的事件、显示正在发展的故障、激活的故障，以及潜在的故障的事件。在几乎所有情况下，故障检测能力都是故障恢复的前提。 RES06 故障检测 RES07 监控告警父主题：韧性支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
更多参考文档 - 云架构中心
更多参考文档 - 云架构中心

更多参考文档华为云零信任能力成熟度模型白皮书企业上云安全白皮书华为云安全白皮书华为云隐私保护白皮书华为云服务的安全特性华为云安全配置基线指南父主题：安全性支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱
RES08 依赖减少与降级 - 云架构中心

RES08 依赖减少与降级对于应用系统，需要识别和管理系统依赖项。应用系统设计人员需要维护对其他系统组件的依赖项的完整列表，包括系统内和系统外的所有依赖。应用系统应尽可能减少关键依赖项，即减少由于该依赖项不可用而导致服务中断的组件。 RES08-01 减少强依赖项 RES08-02 依赖松耦合

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
OPS01-02 规划标准化的运维组织 - 云架构中心

其余时间开展转维验收、应急预案与演练等主动运维活动，对现网的稳定性和可用性负责。三线聚焦解决软件版本缺陷问题。此外也可以使用DevOps模式，由开发工程师直接运维系统，而保留一个小而精干的卓越运营使能团队，用于负责组织整体的卓越运营流程改进和相应的流程工具落地。无论如何设立组

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
RES02 备份 - 云架构中心
RES02 备份 - 云架构中心

以不同，即RPO不同；为了保证数据备份的RPO目标，需要采用定期自动备份，而不要依赖人工进行手工备份。 RES02-01 识别和备份应用中所有需要备份的关键数据 RES02-02 自动数据备份 RES02-03 定期进行备份数据恢复父主题：高可用设计

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

Join减少Shuffle的次数，大幅提升性能不同SQL语句，完成同一个功能，生成Map Reduce的数量越少越好 Hive系统默认是典型的配置场景，结合业务实际情况，可以做一些参数的调整，如文件块的大小，Map个数与Reduce的个数，压缩算法等。合理的使用分区，分区数量不要太多，查询的SQL尽量指定具体的分区值；

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

银行，投资，金融，政府，电信，关键企业应用系统的可用度依赖于系统内各业务单元的可用度。各业务单元之间典型的可靠性模型有两类：串联模型：组成系统的所有单元中任一单元的故障都会导致整个系统故障的称为串联系统。可靠性数学模型：举例：假定系统存在2个串联单元，每个单元的可用度均为99.9%，则系统可用度为

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
RES13 过载保护 - 云架构中心
RES13 过载保护 - 云架构中心

通过过载保护，可以缓解客户流量突增、泛洪攻击或重试风暴所造成的大量容量峰值情况，让工作负载能够继续正常处理支持的请求量，避免出现资源耗尽而导致所有请求都不能处理的情况。 RES13-01 采用自动弹性扩缩容 RES13-02 应用系统负载均衡，避免流量不均匀 RES13-03 过载检测与流量控制

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制
PERF01-01 全生命周期性能管理 - 云架构中心

变化的。需要预留足够的时间来进行持续的性能优化，可以构建性能驱动的优化文化，让团队成员主动监视性能数据；通过指标数据驱动改进，使用新的设计模式和新的技术来优化体系结构。性能优化成熟度模型父主题：全生命周期性能管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF01 流程与规范 > 全生命周期性能管理
RTO与RPO - 云架构中心
RTO与RPO - 云架构中心

灾难恢复能力等级能力要求 RTO RPO 1 基本支持：基本支持备份介质并场外存放 2天以上 1天至7天 2 备用场地支持：有备份场地，能调配所有资源 24小时以上 1天至7天 3 电子传输和设备支持：关键数据定时传送，备用网络部分就绪 12小时以上数小时至1天 4 电子传输及完整

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
变更防差错 - 云架构中心
变更防差错 - 云架构中心

变更防差错在系统的运行过程中，配置变更是导致生产系统不可用的重要风险之一，如配置修改、工作负载手工增缩或补丁安装等。当变更失败时，可能会导致性能下降或业务中断等严重的问题。因此为了降低变更带来的业务风险，需要为工作负载或其环境的更改做好准备，实现工作负载的可靠操作。变更操作属

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
RES13-05 资源自动扩容考虑了配额限制 - 云架构中心

业务的需要申请扩大对应云服务指定资源的配额，也可配置配额预警，以便在配额达到预警阈值时可收到告警通知，以便提前申请提升配额。当应用系统中涉及到资源的弹性伸缩时，尤其需要关注弹性伸缩的配置是否会被限制，比如AS弹性伸缩服务中可以配置能创建的最大实例数量，而在过载情况下是否能真的创

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护

总条数： 212

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES12-04 出现问题后尽快恢复业务 - 云架构中心

SEC02-02 安全的登录机制 - 云架构中心

SEC10-05建立复盘机制 - 云架构中心

RES08-02 依赖松耦合 - 云架构中心

SEC10-02 制定事件响应计划 - 云架构中心

OPS01-01 建立持续学习和改进的文化 - 云架构中心

可用性需求 - 云架构中心

PERF04-04 资源性能数据收集 - 云架构中心

故障全面检测 - 云架构中心

更多参考文档 - 云架构中心

RES08 依赖减少与降级 - 云架构中心

OPS01-02 规划标准化的运维组织 - 云架构中心

RES02 备份 - 云架构中心

HIVE优化 - 云架构中心

可用度及SLO - 云架构中心

RES13 过载保护 - 云架构中心

PERF01-01 全生命周期性能管理 - 云架构中心

RTO与RPO - 云架构中心

变更防差错 - 云架构中心

RES13-05 资源自动扩容考虑了配额限制 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线