搜索_华为云

RES14-02 自动化变更 - 云架构中心

RES14-02 自动化变更自动化变更是指自动化提供并管理应用程序的环境（计算、存储、网络、中间件服务等）、安装、配置，实现Infrastructure as a Code；以解决手工部署中易于出错、依赖个人能力，手工配置中变更无法跟踪、难以回滚等难题。风险等级高关键策略

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
PERF03-11 选择合适的非关系型数据库 - 云架构中心

适用于互联网应用、工业数据采集等场景。 GeminiDB Mongo接口：GeminiDB Mongo 接口是一款基于华为自研的计算存储分离架构，兼容MongoDB生态的云原生NoSQL数据库。具有企业级性能、灵活弹性、高可靠、可视化管理等特点，广泛应用于游戏应用等场景。 GeminiDB

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的数据库资源
RES03-04 支持容灾管理 - 云架构中心

支持容灾管理提供容灾管理功能，实现容灾状态及RPO监控，及异常场景下的业务切换。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。支持应用级数据校验，比较AZ间数据同步差异，监控及PO指标。典型确定性故障场景下自动容灾或切换，无需人工接入，业务不受影响，满足RPO/RTO指标。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES15-04 灰度部署和升级 - 云架构中心

控更改以便发现错误，直到所有部署完成。蓝绿部署与金丝雀部署类似，只是会并行部署一整套应用程序，形成两套生产环境：蓝环境和绿环境，蓝色是当前版本并拥有实时流量，绿色是包含更新代码的环境。当应用程序已经准备就绪，用户可以将所有流量都将路由到绿环境中，当出现问题时，可以快速将流量重新路由回蓝环境，进行故障恢复。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

Review）：对于您云上业务是否在产品环境有问题的审查，以确定产品/应用已做好产品发布准备，在运维阶段是否有问题。值得注意的是，由于云上应用迭代更新的特性，产品可用度评审不应该只是在产品刚上线时进行审查，而以后则置之不理。由于您的云上应用不断更新，这个流程应该定期/或者由重大事件（比如电商企业的促销）触发。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
SEC03-04 安全共享资源 - 云架构中心

大企业往往涉及多个组织单元、多个账号，需要对多账号之间进行共享资源。安全共享资源需遵循以下实践：使用资源标签。通过标签对资源进行分类和标记，以便于管理和应用策略。仅与可信实体共享资源。通过使用服务控制策略（SCP）限制权限，您可以限制组织内账户的权限，确保资源仅在组织内部共享。创建专门的服务账号用于共享资源的访问。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC03 权限管理
RES04 跨Region/跨云容灾 - 云架构中心

正常运行，将损失降到最小。对于跨Region容灾场景，应用系统可在多个Region中部署，并将数据从一个Region复制到另一个Region，以便在发生地区级服务中断或数据丢失时可进行灾难恢复。对于跨云容灾场景，当应用系统已部署在IDC或其他云中，可以在华为云中另外部署一套系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
OPS02-01 进行需求管理和迭代开发 - 云架构中心

同时从可维护性来看，较之于一次性颠覆性的大范围应用/软件更新，小步快跑，持续迭代地进行云上软件的更新更有利于运维，因为一则小范围的云上软件更新和部署更不容易引起大范围事故，其次，不停地迭代更新也有效地保证了开发，运维团队成员能够时刻处于练兵状态，不至于对运维的流程，最佳实践比较陌生。要保证云上应用进行迭代更新，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
RES02 备份 - 云架构中心
RES02 备份 - 云架构中心

RES02 备份对于应用系统中的重要数据，需要提供备份功能，以便在病毒入侵、人为误删除、软硬件故障等场景，能够快速将数据恢复到备份点。由于容灾通常对数据采用实时复制且没有多备份点，在主数据被误删或误改的情况下，错误数据会同步到备端，从而无法达到数据备份的效果，因此通常不能使用容灾来代替备份。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
资源编排服务(RFS) - 云架构中心

资源编排服务(RFS) 资源编排服务是完全支持业界事实标准Terraform（HCL + Provider）的新一代云服务资源终态编排引擎，在应用编排服务(AOS)基础上实现了生态、体验、特性的全新升级；资源编排服务基于业界开放生态HCL语法模板，实现云服务资源的自动化批量构建，帮助

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
基础概念 - 云架构中心
基础概念 - 云架构中心

程和设置来配置和支持基础设施的能力。任何应用程序环境都需要许多基础设施组件，例如操作系统、数据库连接和存储。开发人员必须定期设置、更新和维护基础设施，以开发、测试和部署应用程序。手动管理基础设施既耗时又容易出错，尤其是在大规模管理应用程序时。 CI/CD 持续集成/持续交付

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程计时，以确定应用系统的RPO与RTO目标能否满足。演练期间可检查灾难恢复计划执行顺序及恢复时间并进行优化。相关云服务和工具多活高可用服务 MAS 父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
OPS03-02 使用多个环境进行集成测试，构建和生产环境相同的预生产环境 - 云架构中心

使用多个环境进行集成测试，构建和生产环境相同的预生产环境风险等级高关键策略开发者测试虽然成本低，但是缺乏对生产环境配置以及不同服务和应用之间实际交互的验证。为此，您的组织可以在云上提供多个环境，典型的环境包含测试环境，预生产环境和生产环境。在生产环境部署之前，可以通过测试环

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

健康检查是指容器运行过程中，根据用户需要，定时检查容器健康状况。若不配置健康检查，如果容器内应用程序异常，Pod将无法感知，也不会自动重启去恢复。最终导致虽然Pod状态显示正常，但Pod中的应用程序异常的情况。 Kubernetes提供了三种健康检查的探针：存活探针：livenes

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
RES09 故障重试 - 云架构中心
RES09 故障重试 - 云架构中心

RES09 故障重试当应用系统部署在云中，虽然云具有一定的高可用和故障自动恢复能力，但对外仍会导致短时间的故障，需要应用系统能针对这种短时间故障进行适配处理，主要是采用重试机制。云中故障需要重试的典型场景有：实例主备切换时可能会导致连接中断，如DCS、RDS实例由于某些原因

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
OPS07-01 创建可操作的告警 - 云架构中心

屏蔽某些日志：对难以调整日志级别的应用，根据关键字屏蔽某些频繁的日志告警。预警增强：对于某些影响业务方的操作，提供预警。增强紧急预警：有些硬件故障会出现反应在 /var/log/messages 中，根据关键字匹配硬件类告警，以便及时处理。相关云服务和工具应用运维管理 AOM 云运维中心

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
RES13 过载保护 - 云架构中心
RES13 过载保护 - 云架构中心

可能会导致部分请求失败，失败触发业务重试，会进一步增加系统的负荷，形成恶性循环，导致业务成功率远远低于系统的设计容量，甚至整体不可用。因此应用应该设计过载保护机制，使得在过载状态下依然可以保证一定比例设计容量的处理能力。通过过载保护，可以缓解客户流量突增、泛洪攻击或重试风暴所造

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制
RES08-03 减少被依赖项故障的影响 - 云架构中心

优化性能，减少消息响应时延和负载。使用优先队列，优先处理高优先级用户的请求，以便在流量过载时不影响应用系统的核心功能。流量过载时支持功能逐步降级。被依赖项本身的功能受损时，提供缺省处理，以便应用系统仍可继续正常运行；由于缺省处理可能与实际配置有差异，此时需要告警以便通知系统管理员解决问题。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES11-02 压力负载测试 - 云架构中心

压力负载测试通过施加超出系统容量的业务压力，验证云服务的过载保护、业务隔离和优雅降级等能力。为全面验证系统整体的容量规划和业务依赖，云服务应用通常采用全链路压测进行测试。风险等级高关键策略模拟大量接口消息进行压力测试。模拟各种业务场景进行压力测试。持续自动测试。性能

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
COST07-01 持续监控资源利用率指标 - 云架构中心

持续地在组织中定义资源的核心利用率指标（如CPU利用率，内存，CDN服务的流量，数据库的TPS），按（天、周、月）等时间周期发现规律，对低利用率资源的应用/项目进行审查。父主题： COST07 管理和优化资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST07 管理和优化资源

总条数： 216

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES14-02 自动化变更 - 云架构中心

PERF03-11 选择合适的非关系型数据库 - 云架构中心

RES03-04 支持容灾管理 - 云架构中心

RES15-04 灰度部署和升级 - 云架构中心

OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

SEC03-04 安全共享资源 - 云架构中心

RES04 跨Region/跨云容灾 - 云架构中心

OPS02-01 进行需求管理和迭代开发 - 云架构中心

RES02 备份 - 云架构中心

资源编排服务(RFS) - 云架构中心

基础概念 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

OPS03-02 使用多个环境进行集成测试，构建和生产环境相同的预生产环境 - 云架构中心

可靠性功能 - 云架构中心

RES09 故障重试 - 云架构中心

OPS07-01 创建可操作的告警 - 云架构中心

RES13 过载保护 - 云架构中心

RES08-03 减少被依赖项故障的影响 - 云架构中心

RES11-02 压力负载测试 - 云架构中心

COST07-01 持续监控资源利用率指标 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线