搜索_华为云

OPS05 运维准备和变更管理 - 云架构中心

OPS05 运维准备和变更管理 OPS05-01 进行生产准备度评审（Product Readiness Review） OPS05-02 进行变更风控 OPS05-03 定义变更流程父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

应用层进行重试，以应对暂时性故障，如GaussDB(for MySQL)实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。当GaussDB(for MySQL)实例由于过载导致网络限制时，可参考“RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高”的处理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > GaussDB(for MySQL)云数据库
信息管理类应用典型部署架构（99.95%） - 云架构中心

GaussDB、DDS数据库自动备份，在数据故障时使用最新备份数据恢复，可以满足可用性目标要求。容灾应用跨3AZ部署，AZ故障时自动恢复。监控告警支持业务运行状况、成功指标的检查，在发生故障时告警；支持云服务实例负载状态及资源故障切换等的监控，在负载超过阈值或状态异常时告警。弹性扩缩容针对内

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
Serverless性能优化 - 云架构中心

Serverless函数配置最佳实践运行时语言当选择编译型语言（如Java，C#等），冷启动时延一般由于首次初始化消耗比较大会导致冷启动时延偏高，但是初始化完成后每次执行的时延相较其他解释型语言（NodeJs，Python等）会有一定优势。如果流量不均衡，且对冷启动时延或者最大时延有一定要求的业务使用NodeJs

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
RES05-01 网络连接高可用 - 云架构中心

网络链路快速倒换：需要定期检查网络链路的连通性，但检测到失败时需要尽快切换到正常路径。公有云组网场景可通过多EIP 弹性IP及DNS域名解析实现网络连接的高可用；对可用性要求较高的场景，需要支持智能DNS功能，能对EIP进行异常监控和自动切换；此外DNS自身也需要冗余容错，避免由于DNS故障而导致域名解析失败，业务中断。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES05 网络高可用
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/磁盘/带宽使用率。恢复：当CPU/内存使用高时，可根据业务情况，手工修改代理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用率高时，可根据业务情况，变更规格以支持更大带宽。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
RES03-01 集群跨AZ部署 - 云架构中心

或ELB跨AZ负载均衡能力，实现跨AZ高可用，在一个可用区故障时能自动快速切换。对于有状态ECS实例，或BMS实例，建议从应用层实现跨AZ容灾，支持跨AZ自动切换或通过容灾管理工具实现自动化容灾切换，减少灾难发生时的人工操作。对于已部署的应用系统改造为跨AZ实例的实施步骤：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 - 云架构中心

OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 OPS02-01 进行需求管理和迭代开发 OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES15-02 自动化检查 - 云架构中心

RES15-02 自动化检查在部署或升级过程中集成基本测试功能，实现自动化检查，无需人工参与。风险等级高关键策略在部署或升级过程中集成基本测试功能，在部署或升级完成后自动进行检查和测试，以验证新部署的代码功能是否正确。在部署或升级过程中集成故障注入测试功能，在部署或升

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
组织级参考架构 - 云架构中心
组织级参考架构 - 云架构中心

统一控制策略管理：为各个组织单元和成员账号设置服务控制策略，强制限定成员账号下IAM用户（包括成员账号的管理员用户）的权限上限，避免用户权限过大带来安全风险，创建服务控制策略时可以将其应用到某一个组织单元，该服务控制策略可以继承到关联的成员账号和下层组织单元。统一身份权限管理：针对整个企业在华为云上的所有账号进行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 参考架构
RES15-01 自动化部署和升级 - 云架构中心

RES15-01 自动化部署和升级部署和升级过程由代码实现，以固化部件间依赖、安装和配置过程，减少人工错误。风险等级高关键策略部署和升级过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

其次，在软件开发生命周期内，推动开发人员采用代码质量最佳实践，例如，使用代码审查或结对编程等最佳实践来提高代码质量，确保每行代码在合入代码仓时，都有两个以上的工程师审查过，同时，通过设置代码合入策略进行代码控制，确保代码审查规范的执行。最后，建议通过自动化代码检查策略进行代码问题检查。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
单Region方案 - 云架构中心
单Region方案 - 云架构中心

应用在两个AZ各部署一套，进行双向复制，双活容灾；AZ故障时自动恢复。监控告警进行站点运行状态检查，在发生故障时告警；针对CCE、DCS、kafka、RDS、DDS等实例负载状态进行监控，在资源过载时需要告警。弹性扩缩容 CCE集群支持工作负载的自动弹性伸缩。变更防差错软件更新采用金丝雀或蓝绿部

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

关键策略 Production Readiness Review 生产准备度评估基线：从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度，对服务可用性及运维能力提出基线要求。在服务产品开发前端构筑能力，进行相关需求规划、设计和开发工作，并在服务上线前进行生产准入审视。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率。恢复：根据业务情况，手工变更节点规格或增加节点数量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
设计原则 - 云架构中心
设计原则 - 云架构中心

及早控制：系统过载时，应尽可能在业务流程处理前端或业务处理较早的处理模块或底层协议层次上控制业务接入，避免中间控制带来不必要的性能消耗。优先级保障：系统过载时保证高优先级的业务能够优先获得资源，优先得到处理，从而保证社会效益最大化。变更防差错当对系统进行升级部署、配置变更时，需要防止

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

通过标准化的、统一的运维工具，向运维人员提供集中、统一维护界面及清晰易上手的操作手册，方便运维人员的集中维护，提高运维效率。常见的运维流程有：变更管理流程：适用于生产环境软、硬件的变更活动管理，减少变更导致服务意外中断或服务质量下降，确保企业的环境安全、稳定地运行，并最大化的提升系统的可用性，满足所承诺的服务水平。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

备份服务对ECS进行定期备份，在数据被删除时使用备份数据快速恢复。 ECS实例使用本地盘时本地盘故障检测：应用层检测本地盘运行状态。恢复：应用层采用RAID实现ECS内硬盘高可用，并实现跨ECS的数据复制与高可用，以便在本地盘故障时业务可快速恢复。建议非必须使用本地盘场景，尽

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
OPS02-01 进行需求管理和迭代开发 - 云架构中心

据需求划分迭代计划。相关云服务和工具华为云CodeArts Req服务父主题： OPS02 通过CI/CD实现高效的频繁可逆的小规模变更

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

保障业务可靠性；对于有状态业务，由应用层实现多实例高可用。应用层进行重试，以应对暂时性故障，如网络过载时；应用故障重试处理可参考“故障重试”。当BMS由于过载导致网络限制时，可参考“BMS的CPU /内存/磁盘容量/磁盘IOPS使用率过高”的处理。 BMS实例不可用或运行异常

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务

总条数： 103

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS05 运维准备和变更管理 - 云架构中心

常见故障模式 - 云架构中心

信息管理类应用典型部署架构（99.95%） - 云架构中心

Serverless性能优化 - 云架构中心

RES05-01 网络连接高可用 - 云架构中心

常见故障模式 - 云架构中心

RES03-01 集群跨AZ部署 - 云架构中心

OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 - 云架构中心

RES15-02 自动化检查 - 云架构中心

组织级参考架构 - 云架构中心

RES15-01 自动化部署和升级 - 云架构中心

OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

单Region方案 - 云架构中心

OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

常见故障模式 - 云架构中心

设计原则 - 云架构中心

OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

常见故障模式 - 云架构中心

OPS02-01 进行需求管理和迭代开发 - 云架构中心

常见故障模式 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线