搜索_华为云

RES15-04 灰度部署和升级 - 云架构中心

回滚过程中的业务中断，提升系统可用性。风险等级高关键策略通过金丝雀部署、蓝绿部署等方式实现灰度升级或部署，逐步引入新版本部署范围或切换用户流量，配合自动回退以降低部署差错导致业务中断的风险。金丝雀部署（灰度发布）是将少量客户引导到新版本的做法，通常在单个服务实例（Can

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES15-03 自动化回滚 - 云架构中心

RES15-03 自动化回滚在升级或部署过程中出现异常，或检查/测试失败时，支持自动回滚，减少人工干预，避免回滚失败。风险等级高关键策略检测到异常后，可一键式回滚。回滚过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

关键策略 Production Readiness Review 生产准备度评估基线：从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度，对服务可用性及运维能力提出基线要求。在服务产品开发前端构筑能力，进行相关需求规划、设计和开发工作，并在服务上线前进行生产准入审视。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
RES15-01 自动化部署和升级 - 云架构中心

RES15-01 自动化部署和升级部署和升级过程由代码实现，以固化部件间依赖、安装和配置过程，减少人工错误。风险等级高关键策略部署和升级过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
信息管理类应用典型部署架构（99.95%） - 云架构中心

99.95%，即每年故障时长可以为4.38小时。假定故障中断与变更中断的时长分别如下：故障中断：假定每年故障中断4次，每次应急恢复决策时长为20分钟，恢复处理时长为10分钟，则每年故障中断时长为120分钟。变更中断：假定应用支持离线更新与在线补丁，每年离线更新4次，每次更新

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
OPS02-01 进行需求管理和迭代开发 - 云架构中心

据需求划分迭代计划。相关云服务和工具华为云CodeArts Req服务父主题： OPS02 通过CI/CD实现高效的频繁可逆的小规模变更

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

通过标准化的、统一的运维工具，向运维人员提供集中、统一维护界面及清晰易上手的操作手册，方便运维人员的集中维护，提高运维效率。常见的运维流程有：变更管理流程：适用于生产环境软、硬件的变更活动管理，减少变更导致服务意外中断或服务质量下降，确保企业的环境安全、稳定地运行，并最大化的提升系统的可用性，满足所承诺的服务水平。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率。恢复：根据业务情况，手工变更节点规格或增加节点数量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

过载检测与流量控制支持主动扩容资源自动扩容考虑了配额限制压力负载测试 RES14 您如何进行配置防差错？变更防呆检查自动化变更变更前数据备份提供runbook进行标准化变更 RES15 您如何进行升级不中断业务？自动化部署和升级自动化检查自动化回滚灰度部署和升级父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

华为云CodeArts Artifact服务华为云CodeArts Repo服务父主题： OPS02 通过CI/CD实现高效的频繁可逆的小规模变更

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
SEC09-03 实施安全审计 - 云架构中心

风险等级高关键策略云服务的关键操作包含高危操作（如创建IAM用户、删除IAM用户、重启虚拟机、变更安全配置等）、成本敏感操作（创建、删除高价资源等）、业务敏感操作（网络配置变更等）。启用关键操作通知功能。启用云审计服务CTS的关键操作通知功能后，CTS会对这些关键操作通过消

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
金融类核心应用典型部署架构（99.999%） - 云架构中心

999%，即每年故障时间可以为5.26分钟。假定故障中断与变更中断的时长分别如下：故障中断：由于要求的故障中断时间很短，要求尽可能自动恢复，没有手动触发的恢复，假定每年故障中断4次，每次自动恢复时长为1分钟，则每年故障中断时长为4分钟。变更中断：假定应用支持金丝雀部署或蓝绿部署，并自动完成，软件更新不中断业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

ECS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护，保障优先业务的运行。连接后端ECS失败

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如RDS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
成本优化云服务介绍 - 云架构中心

用情况、监控和跟踪华为云成本，及时了解云支出的趋势和动因，减少异常支出，持续成本优化。费用中心为您提供财务信息、发票、合同、续费、退订和变更等服务，有助于更好的了解您的消费信息。同时费用中心还提供余额预警、资源包预警等服务，可以帮助您及时了解支出情况，管控支出。企业中心面向

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如DCS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。应用层进行过载保护，保障优先业务的运行。连接后端GaussDB(for

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > GaussDB(for MySQL)云数据库
韧性支柱简介 - 云架构中心
韧性支柱简介 - 云架构中心

一系列设计原则与最佳实践，用以帮助企业利用华为云平台基础设施达到高可用、面向各种故障场景进行韧性设计，并具备一定的灾备能力；同时通过规范化变更、部署及应急恢复等处理流程，减少业务中断时长，提升可用性。华为云韧性支柱的设计框架如下图所示：父主题：韧性支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
缓存性能优化 - 云架构中心
缓存性能优化 - 云架构中心

缓存性能优化以下章节我们结合一些具体建议和案例来说明如何针对缓存的使用进行性能优化。 Redis使用规范如下的规范可以帮助我们在系统运行过程中，尽可能减少遇到redis不稳定或异常的概率，保证系统的长稳运行。业务使用规范原则原则说明级别备注就近部署业务，避免时延过大

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
基础概念 - 云架构中心
基础概念 - 云架构中心

Identify）平均发现时长、MTTK（Mean Time to Know）平均诊断时长、MTTF（Mean Time to Fix）平均修复时长变更风险控制在变更作业过程中，建立事前检查、事中拦截和事后验证的能力，防止异常行为。安全生产安全生产目的是为了持续保障现网“安全、稳定、高质量”

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱

总条数： 144

上一页
1
2
3
4
5
...
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES15-04 灰度部署和升级 - 云架构中心

RES15-03 自动化回滚 - 云架构中心

OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

RES15-01 自动化部署和升级 - 云架构中心

信息管理类应用典型部署架构（99.95%） - 云架构中心

OPS02-01 进行需求管理和迭代开发 - 云架构中心

OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

常见故障模式 - 云架构中心

问题和检查项 - 云架构中心

OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

SEC09-03 实施安全审计 - 云架构中心

金融类核心应用典型部署架构（99.999%） - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

成本优化云服务介绍 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

韧性支柱简介 - 云架构中心

缓存性能优化 - 云架构中心

基础概念 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线