搜索_华为云

OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

华为云CodeArts Artifact服务华为云CodeArts Repo服务父主题： OPS02 通过CI/CD实现高效的频繁可逆的小规模变更

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
设计原则 - 云架构中心
设计原则 - 云架构中心

性能消耗。优先级保障：系统过载时保证高优先级的业务能够优先获得资源，优先得到处理，从而保证社会效益最大化。变更防差错当对系统进行升级部署、配置变更时，需要防止变更过程中由于人因差错导致系统和业务受损或失效。通常采用防呆的方式来减少人因差错。防呆是一种预防矫正的行为约束手段

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
SEC04-02 控制网络流量的访问 - 云架构中心

对所有网络流量进行检查，阻止与已制定安全标准不相符的流量，以避免系统组件受到来自不可信网络的非授权访问。使用应用负载均衡时，七层负载均衡更换为安全的证书。启用VPC流量日志。VPC流日志功能可以记录虚拟私有云中的流量信息，帮助用户优化安全组和防火墙控制规则、监控网络流量、进行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC04 网络安全
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

ECS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护，保障优先业务的运行。连接后端ECS失败

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如RDS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
SEC09-03 实施安全审计 - 云架构中心

风险等级高关键策略云服务的关键操作包含高危操作（如创建IAM用户、删除IAM用户、重启虚拟机、变更安全配置等）、成本敏感操作（创建、删除高价资源等）、业务敏感操作（网络配置变更等）。启用关键操作通知功能。启用云审计服务CTS的关键操作通知功能后，CTS会对这些关键操作通过消

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如DCS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。应用层进行过载保护，保障优先业务的运行。连接后端云数据库 TaurusDB失败

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
云运维中心(COC) - 云架构中心
云运维中心(COC) - 云架构中心

风险评估：基于场景规则、流程规则、业务规则对变更进行管控，提前识别和拦截变更风险；通过变更日历实现变更冲突检测，降低服务间变更依赖导致的变更风险。实施保障：按预定方案执行变更，变更步骤标准化、可观测，变更异常及时介入处理，实现变更实施全过程可控、可视、可管。确定性故障管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
RES03-01 集群跨AZ部署 - 云架构中心

或ELB跨AZ负载均衡能力，实现跨AZ高可用，在一个可用区故障时能自动快速切换。对于有状态ECS实例，或BMS实例，建议从应用层实现跨AZ容灾，支持跨AZ自动切换或通过容灾管理工具实现自动化容灾切换，减少灾难发生时的人工操作。对于已部署的应用系统改造为跨AZ实例的实施步骤：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES03 跨AZ容灾 - 云架构中心
RES03 跨AZ容灾 - 云架构中心

或应用自身支持的跨AZ数据复制与切换能力，在多个AZ之间复制数据、负载均衡和跨AZ故障切换，从而使应用系统具备应对可用区故障的能力。 RES03-01 集群跨AZ部署 RES03-02 跨AZ数据同步 RES03-03 对接容灾仲裁，支持自动切换 RES03-04 支持容灾管理父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA RDS服务支持HA主备高可用架构，故障秒级自动切换。数据持久性 RDS数据持久性高达99.9999999%，保证数据安全可靠，保护业务免受故障影响。数据备份和恢复 RDS支持每天自动备份数据，备份都是以压缩包的形式自动存储在对象存储服务（Object Storage

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

有效落地持续集成 2. 采用持续部署模型 3. 基础设施即代码 4. 自动化工程运维任务 OPS05 是否有运维准备和变更管理体系？ 1. 进行生产准备度评审 2. 进行变更风控 3. 定义变更流程 OPS06 是否建立了完备的可观测体系？ 1.建立可观测体系 2.定义可观测对象 3.制定和实施可观测性指标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
卓越运营支柱 - 云架构中心
卓越运营支柱 - 云架构中心

建立持续改进的团队文化和标准化的运维体系 OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 OPS03 完备的测试验证体系 OPS04 自动化构建和部署流程 OPS05 运维准备和变更管理 OPS06 可观测性体系 OPS07 进行故障分析和管理 OPS08 度量运营状态和持续改进

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用率高时，可根据业务情况，变更规格以支持更大带宽。应用层进行过载保护，保障优先业务的运行。生产消息失败检测：生产消息失败恢复：应用层进行重试，以应对暂时性故障；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
OPS06-01 建立可观测性体系 - 云架构中心

路径。如下图所示案例，在故障恢复 MTTR 的逻辑中，当业务发生故障，从故障发现、到故障定级和影响面分析、再到故障定界定位和故障恢复，几乎全部依赖人工处理。要想缩短时间，本质上是监控即发现、监控即定级、监控系统定界、定界即恢复——如果能达成这样的设计就能够形成 MTTR 的最短路径。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
什么是应用韧性 - 云架构中心
什么是应用韧性 - 云架构中心

RDS数据库提供自动数据备份、跨AZ和跨Region的数据复制与切换。不过，即使应用系统利用云平台能力具有了这些高可用能力，要实现较高的可用性，仍需要构建针对各种偶发故障下的恢复能力，如：由于硬件故障导致的高可用切换或跨AZ切换过程中，导致瞬时链接中断，需要应用系统具备链接中断重试的功能。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
概述 - 云架构中心
概述 - 云架构中心

在Region/AZ/IDC或其他云站点发生灾难的情况下的恢复能力监控告警应用系统故障后的检测和告警能力弹性扩缩容应用容量不足时的自动恢复能力变更防差错变更对应用业务中断的影响应急恢复处理应用在故障情况下的应急恢复能力父主题：参考架构

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

过载检测与流量控制支持主动扩容资源自动扩容考虑了配额限制压力负载测试 RES14 您如何进行配置防差错？变更防呆检查自动化变更变更前数据备份提供runbook进行标准化变更 RES15 您如何进行升级不中断业务？自动化部署和升级自动化检查自动化回滚灰度部署和升级父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
RES09 故障重试 - 云架构中心
RES09 故障重试 - 云架构中心

要应用系统能针对这种短时间故障进行适配处理，主要是采用重试机制。云中故障需要重试的典型场景有：实例主备切换时可能会导致连接中断，如DCS、RDS实例由于某些原因主备切换时，会导致连接中断，需要客户端重试。实例由于故障重启可能会导致通信中断，如ECS所在物理服务器由于硬件原因

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复

总条数： 103

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

设计原则 - 云架构中心

SEC04-02 控制网络流量的访问 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

SEC09-03 实施安全审计 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

云运维中心(COC) - 云架构中心

RES03-01 集群跨AZ部署 - 云架构中心

RES03 跨AZ容灾 - 云架构中心

可靠性功能 - 云架构中心

问题和检查项 - 云架构中心

卓越运营支柱 - 云架构中心

常见故障模式 - 云架构中心

OPS06-01 建立可观测性体系 - 云架构中心

什么是应用韧性 - 云架构中心

概述 - 云架构中心

问题和检查项 - 云架构中心

RES09 故障重试 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线