搜索_华为云

OPS02-01 进行需求管理和迭代开发 - 云架构中心

同时从可维护性来看，较之于一次性颠覆性的大范围应用/软件更新，小步快跑，持续迭代地进行云上软件的更新更有利于运维，因为一则小范围的云上软件更新和部署更不容易引起大范围事故，其次，不停地迭代更新也有效地保证了开发，运维团队成员能够时刻处于练兵状态，不至于对运维的流程，最佳实践比较陌生。要保证云上应用进行迭代更新，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
SEC03-04 安全共享资源 - 云架构中心

大企业往往涉及多个组织单元、多个账号，需要对多账号之间进行共享资源。安全共享资源需遵循以下实践：使用资源标签。通过标签对资源进行分类和标记，以便于管理和应用策略。仅与可信实体共享资源。通过使用服务控制策略（SCP）限制权限，您可以限制组织内账户的权限，确保资源仅在组织内部共享。创建专门的服务账号用于共享资源的访问。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC03 权限管理
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程计时，以确定应用系统的RPO与RTO目标能否满足。演练期间可检查灾难恢复计划执行顺序及恢复时间并进行优化。相关云服务和工具多活高可用服务 MAS 父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
OPS03-02 使用多个环境进行集成测试，构建和生产环境相同的预生产环境 - 云架构中心

使用多个环境进行集成测试，构建和生产环境相同的预生产环境风险等级高关键策略开发者测试虽然成本低，但是缺乏对生产环境配置以及不同服务和应用之间实际交互的验证。为此，您的组织可以在云上提供多个环境，典型的环境包含测试环境，预生产环境和生产环境。在生产环境部署之前，可以通过测试环

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
基础概念 - 云架构中心
基础概念 - 云架构中心

程和设置来配置和支持基础设施的能力。任何应用程序环境都需要许多基础设施组件，例如操作系统、数据库连接和存储。开发人员必须定期设置、更新和维护基础设施，以开发、测试和部署应用程序。手动管理基础设施既耗时又容易出错，尤其是在大规模管理应用程序时。 CI/CD 持续集成/持续交付

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

健康检查是指容器运行过程中，根据用户需要，定时检查容器健康状况。若不配置健康检查，如果容器内应用程序异常，Pod将无法感知，也不会自动重启去恢复。最终导致虽然Pod状态显示正常，但Pod中的应用程序异常的情况。 Kubernetes提供了三种健康检查的探针：存活探针：livenes

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
RES09 故障重试 - 云架构中心
RES09 故障重试 - 云架构中心

RES09 故障重试当应用系统部署在云中，虽然云具有一定的高可用和故障自动恢复能力，但对外仍会导致短时间的故障，需要应用系统能针对这种短时间故障进行适配处理，主要是采用重试机制。云中故障需要重试的典型场景有：实例主备切换时可能会导致连接中断，如DCS、RDS实例由于某些原因

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
基本概念 - 云架构中心
基本概念 - 云架构中心

基本概念概念表什么是应用韧性责任共担模式可用性目标定义可用性需求父主题：韧性支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
OPS07-01 创建可操作的告警 - 云架构中心

屏蔽某些日志：对难以调整日志级别的应用，根据关键字屏蔽某些频繁的日志告警。预警增强：对于某些影响业务方的操作，提供预警。增强紧急预警：有些硬件故障会出现反应在 /var/log/messages 中，根据关键字匹配硬件类告警，以便及时处理。相关云服务和工具应用运维管理 AOM 云运维中心

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
RES13 过载保护 - 云架构中心
RES13 过载保护 - 云架构中心

可能会导致部分请求失败，失败触发业务重试，会进一步增加系统的负荷，形成恶性循环，导致业务成功率远远低于系统的设计容量，甚至整体不可用。因此应用应该设计过载保护机制，使得在过载状态下依然可以保证一定比例设计容量的处理能力。通过过载保护，可以缓解客户流量突增、泛洪攻击或重试风暴所造

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制
RES08-03 减少被依赖项故障的影响 - 云架构中心

优化性能，减少消息响应时延和负载。使用优先队列，优先处理高优先级用户的请求，以便在流量过载时不影响应用系统的核心功能。流量过载时支持功能逐步降级。被依赖项本身的功能受损时，提供缺省处理，以便应用系统仍可继续正常运行；由于缺省处理可能与实际配置有差异，此时需要告警以便通知系统管理员解决问题。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES11-02 压力负载测试 - 云架构中心

压力负载测试通过施加超出系统容量的业务压力，验证云服务的过载保护、业务隔离和优雅降级等能力。为全面验证系统整体的容量规划和业务依赖，云服务应用通常采用全链路压测进行测试。风险等级高关键策略模拟大量接口消息进行压力测试。模拟各种业务场景进行压力测试。持续自动测试。性能

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES04-03 容灾恢复过程自动化 - 云架构中心

现容灾状态及RPO监控，以及灾难场景下的一键式自动切换，减少人工干预。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。支持应用级数据校验，比较AZ间数据同步差异，监控及PO指标。灾难场景下的一键式自动切换，减少人工干预，满足RPO/RTO指标。支持容灾恢复流程编排、容灾演练等功能。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES13-05 资源自动扩容考虑了配额限制 - 云架构中心

RES13-05 资源自动扩容考虑了配额限制当应用系统在资源不足自动扩容时，需要考虑配额的限制，若配额不足，会导致自动扩容失败。风险等级高关键策略华为云为防止资源滥用，限定了各服务资源的配额，对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
SEC05-02 实施漏洞管理 - 云架构中心

漏洞扫描和识别：利用华为云云服务对系统、应用程序进行定期扫描，以发现潜在的漏洞和安全弱点。自动化扫描漏洞：使用自动化漏洞扫描工具对运行环境进行定期扫描，以发现潜在的漏洞和安全风险。漏洞修复和补丁管理：制定漏洞修复计划，及时修复已确认的漏洞，并管理安全补丁的发布和应用过程。在关键节点处检测和

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全
RES01-03 云服务器反亲和 - 云架构中心

RES01-03 云服务器反亲和应用内相同业务的ECS需要分散到多台物理服务器，避免运行到同一台物理服务器上，当发生这种情况时，可能会由于一台物理服务器故障而导致业务中断。风险等级高关键策略针对多个承载相同业务的ECS，需要配置主机组反亲和，从而可以将相同业务的ECS调

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES05-01 网络连接高可用 - 云架构中心

RES05-01 网络连接高可用应用系统对外提供服务时，需要确保对外网络连接的高可用，避免单个网络连接中断而导致业务不可用。风险等级高关键策略网络链路冗余：网络连接需要支持多路径，以实现高可用能力，以避免在一条网络路径中断的情况下，业务能切换到其他路径继续通信。网络链

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES05 网络高可用
RES07-02 日志统计监控 - 云架构中心

RES07-02 日志统计监控应用系统需要收集日志，在必要时对日志进行统计分析，设置告警规则触发告警，统计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES11-05 红蓝攻防 - 云架构中心
RES11-05 红蓝攻防 - 云架构中心

RES11-05 红蓝攻防通过红蓝攻防，可以模拟各种复杂的攻击场景，帮助全面评估应用韧性，及时发现并解决潜在风险。风险等级高关键策略蓝军从第三方角度发掘各类脆弱点，并向业务所依赖的各种软硬件注入故障，不断验证业务系统的可靠性；而红军则需要按照预先定义的故障响应和应急流程进行处置。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

问题和检查项问题检查项/最佳实践 PERF01 如何确立流程与规范？全生命周期性能管理应用性能编程规范 PERF02 如何进行性能规划？定义性能目标容量规划 PERF03 如何进行性能建模？选择合适类型的计算云服务选择合适规格的虚拟机和容器节点使用弹性伸缩选择合适类型的网络云服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱

总条数： 209

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS02-01 进行需求管理和迭代开发 - 云架构中心

SEC03-04 安全共享资源 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

OPS03-02 使用多个环境进行集成测试，构建和生产环境相同的预生产环境 - 云架构中心

基础概念 - 云架构中心

可靠性功能 - 云架构中心

RES09 故障重试 - 云架构中心

基本概念 - 云架构中心

OPS07-01 创建可操作的告警 - 云架构中心

RES13 过载保护 - 云架构中心

RES08-03 减少被依赖项故障的影响 - 云架构中心

RES11-02 压力负载测试 - 云架构中心

RES04-03 容灾恢复过程自动化 - 云架构中心

RES13-05 资源自动扩容考虑了配额限制 - 云架构中心

SEC05-02 实施漏洞管理 - 云架构中心

RES01-03 云服务器反亲和 - 云架构中心

RES05-01 网络连接高可用 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

RES11-05 红蓝攻防 - 云架构中心

问题和检查项 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线