搜索_华为云

RES15-01 自动化部署和升级 - 云架构中心

RES15-01 自动化部署和升级部署和升级过程由代码实现，以固化部件间依赖、安装和配置过程，减少人工错误。风险等级高关键策略部署和升级过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
PERF04-01 定义验收标准 - 云架构中心

能涉及响应时间、吞吐量、资源利用率或任何其他相关绩效指标的指标。例如响应时间的目标可能低于特定阈值，如小于2秒。定义验收标准将性能目标转换为可用于评估工作负载性能的特定验收标准。例如，假设响应时间的性能目标是2秒或更短。接受条件可以是工作负载的平均响应时间应小于2秒。使用这些

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
什么是应用韧性 - 云架构中心
什么是应用韧性 - 云架构中心

RDS数据库提供自动数据备份、跨AZ和跨Region的数据复制与切换。不过，即使应用系统利用云平台能力具有了这些高可用能力，要实现较高的可用性，仍需要构建针对各种偶发故障下的恢复能力，如：由于硬件故障导致的高可用切换或跨AZ切换过程中，导致瞬时链接中断，需要应用系统具备链接中断重试的功能。由于外部流量突发

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
OPS01-02 规划标准化的运维组织 - 云架构中心

OPS01-02 规划标准化的运维组织风险等级高关键策略承载卓越运营，应该建立适应您实际的运维组织。运维组织的团队之间具有明确的流程，规定了团队之间的协作方式，例如规定不同团队的响应时间、服务级别目标（SLO) 或服务等级协议(SLA），同时应该记录团队间沟通信息，确保有足够的数据用于后续的改进。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率。恢复：根据业务情况，手工变更节点规格或增加节点数量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

关键策略 Production Readiness Review 生产准备度评估基线：从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度，对服务可用性及运维能力提出基线要求。在服务产品开发前端构筑能力，进行相关需求规划、设计和开发工作，并在服务上线前进行生产准入审视。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
OPS02-01 进行需求管理和迭代开发 - 云架构中心

据需求划分迭代计划。相关云服务和工具华为云CodeArts Req服务父主题： OPS02 通过CI/CD实现高效的频繁可逆的小规模变更

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
RES03-04 支持容灾管理 - 云架构中心

下的业务切换。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。支持应用级数据校验，比较AZ间数据同步差异，监控及PO指标。典型确定性故障场景下自动容灾或切换，无需人工接入，业务不受影响，满足RPO/RTO指标。典型亚健康故障场景，支持业务降级或主动切换，业务不持续受损。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

Service，简称DRS）创建灾备任务，当主实例所在区域发生突发性自然灾害等状况，主节点（Master）和备节点（Slave）均无法连接时，可将异地灾备实例切换为主实例，在应用端修改数据库链接地址后，即可快速恢复应用的业务访问。数据复制服务提供的实时灾备功能，可实现主实例和跨区域的灾备实例之间的单主灾备（详见“M

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

华为云CodeArts Artifact服务华为云CodeArts Repo服务父主题： OPS02 通过CI/CD实现高效的频繁可逆的小规模变更

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
RES04-03 容灾恢复过程自动化 - 云架构中心

容灾恢复过程自动化由于容灾恢复场景涉及容灾站点的业务恢复、数据库的主备切换、业务到容灾站点的流量切换等，恢复过程比较复杂，因此需要提供容灾管理功能，实现容灾状态及RPO监控，以及灾难场景下的一键式自动切换，减少人工干预。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

通过标准化的、统一的运维工具，向运维人员提供集中、统一维护界面及清晰易上手的操作手册，方便运维人员的集中维护，提高运维效率。常见的运维流程有：变更管理流程：适用于生产环境软、硬件的变更活动管理，减少变更导致服务意外中断或服务质量下降，确保企业的环境安全、稳定地运行，并最大化的提升系统的可用性，满足所承诺的服务水平。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

系统会自动切换到只读节点，只读节点提升为主节点，原来故障的主节点也会自动恢复为只读节点。云数据库 TaurusDB服务还支持异构容灾实例(MySQL节点)，支持在极端场景，如社区未知bug、用户误操作、AZ级故障导致服务无法正常提供服务等场景，可以快速将服务切换到异构容灾实例继续提供服务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

ECS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护，保障优先业务的运行。连接后端ECS失败

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如RDS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
SEC09-03 实施安全审计 - 云架构中心

风险等级高关键策略云服务的关键操作包含高危操作（如创建IAM用户、删除IAM用户、重启虚拟机、变更安全配置等）、成本敏感操作（创建、删除高价资源等）、业务敏感操作（网络配置变更等）。启用关键操作通知功能。启用云审计服务CTS的关键操作通知功能后，CTS会对这些关键操作通过消

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

BMS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率恢复：根据业务情况，更换规格更高的BMS实例或增加BMS实例进行负荷分担。应用层进行过载保护，保障优先业务的运行。连接后端BMS失败检测：网络连接失败。恢复：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如DCS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。应用层进行过载保护，保障优先业务的运行。连接后端云数据库 TaurusDB失败

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
金融类核心应用典型部署架构（99.999%） - 云架构中心

999%，即每年故障时间可以为5.26分钟。假定故障中断与变更中断的时长分别如下：故障中断：由于要求的故障中断时间很短，要求尽可能自动恢复，没有手动触发的恢复，假定每年故障中断4次，每次自动恢复时长为1分钟，则每年故障中断时长为4分钟。变更中断：假定应用支持金丝雀部署或蓝绿部署，并自动完成，软件更新不中断业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构

总条数： 103

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES15-01 自动化部署和升级 - 云架构中心

PERF04-01 定义验收标准 - 云架构中心

什么是应用韧性 - 云架构中心

OPS01-02 规划标准化的运维组织 - 云架构中心

常见故障模式 - 云架构中心

OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

OPS02-01 进行需求管理和迭代开发 - 云架构中心

RES03-04 支持容灾管理 - 云架构中心

可靠性功能 - 云架构中心

OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

RES04-03 容灾恢复过程自动化 - 云架构中心

OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

SEC09-03 实施安全审计 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

金融类核心应用典型部署架构（99.999%） - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线